Chương trình máy tính bayesvl trong môi trường R: Đóng góp Việt cho khoa học thế giới
Chương trình bayesvl được thiết kế với định hướng sư phạm, hỗ trợ người sử dụng làm quen với phương pháp thống kê Bayesian dựa trên mô hình lưới Bayesian, mô phỏng MCMC, hình ảnh hóa các thông số kĩ thuật và kết quả.
Có thể hiểu đơn giản bayesvl giúp dựng mô hình rồi tạo ra code stan, và sau đó tận dụng các hàm vẽ đồ họa của chương trình. Hướng tới khoa học mở, ngay từ trong quá trình phát triển, chương trình đã được các tác giả đăng tải trên trang chia sẻ phần mềm và code GitHub.
Kĩ sư Lã Việt Phương cho biết: “Chương trình bayesvl được lên ý tưởng từ cuối năm 2017 đến nay. Trong thời gian đó, phương pháp Bayesian đã được Trung tâm ISR nghiên cứu, thử nghiệm, và sử dụng thành công trong các công bố của trung tâm. Tuy nhiên, việc ứng dụng phương pháp này cần nhiều thời gian làm quen do sự phức tạp của các chương trình đã được phát triển sẵn như rstan.
Chúng tôi nhận thấy nhu cầu thiết thực cho một chương trình thống kê Bayesian dễ sử dụngs, nên đã bắt tay vào thiết kế và triển khai dự án. Sau hơn 18 tháng, và hơn 3000 dòng code, chương trình bayesvl cuối cùng đã chính thức được CRAN chấp nhận và xuất bản.”
Đầu năm 2018 đến nay, Trung tâm ISR đã áp dụng phương pháp Bayesian thành công trong nghiên cứu về truyện cổ tích và văn hóa Việt Nam trên tạp chí Palgrave Communications thuộc Nature Research. Sau đó, từ đầu năm 2019 đến nay, trung tâm đã sử dụng bayesvl trong 2 công bố trên tạp chí Data [ESCI; Scopus] thuộc nhà xuất bản MDPI, và một bản thảo về tiếp biến văn hóa và phố cổ Hà Nội đang trong quá trình phản biện.
Ngày 18/5/2019, phần mềm được nộp vào hệ thống CRAN và sau 4 lần chỉnh sửa theo yêu cầu của kĩ thuật viên của CRAN, phiên bản 0.8.5 chính thức được xuất bản vào ngày 24/5/2019 với tên chính thức: bayesvl: Visually Learning the Graphical Structure of Bayesian Networks and Performing MCMC with 'Stan'.
Anh Nguyễn Minh Hoàng, hiện đang là du hoc sinh tại trường Đại học Ritsumeikan Asia Pacific University, Nhận Bản, đã sử dụng bayesvl từ phiên bản 0.6 khi chương trình vẫn còn trong giai đoạn phát triển. Anh nhận xét: “Mình đã tìm đọc và làm quen với phương pháp Bayesian trong suốt thời gian nghiên cứu thạc sĩ từ năm 2017. Tuy nhiên, việc ứng dụng nó vào thực tế lại rất khó khăn do bản thân phương pháp, dù mạnh mẽ, nhưng chưa phổ biến do sự phức tạp của các yếu tố toán học và code máy tính. Chính vì vậy, ngay khi tìm thấy bayesvl trên GitHub, mình đã thử sử dụng theo hướng dẫn.
Chương trình này được thiết kế dễ hiểu, giảm thiểu thời gian vật lộn với code máy tính. Đồng thời, phần mềm cũng kích thích người dùng đầu tư vào quá trình thiết kế đầu bài, mô hình tính toán để quá trình triển khai thuận lợi. Mình khá ưng ý với sư đầu tư vào sản xuất hình ảnh của chương trình. Mô hình hay kết quả đều được thể hiện rõ ràng qua đồ họa, giúp đỡ quá trình làm luận án của mình rất nhiều.”
Trong thời đại công nghệ 4.0 hiện nay, ngay cả với lĩnh vực KHXHNV cũng đang dần chuyển mình trước làn sóng dữ liệu, khoa học mở, và phương pháp thống kê. Khi các tranh cãi về ý nghĩa thống kê, về tái xác lập kết quả vẫn đang khiến giới khoa học thế giới xôn xao, chương trình bayesvl do hai tác giả Việt Nam xuất bản này là một đóng góp quan trọng về phương pháp luận cho cộng đồng khoa học Việt Nam và thế giới. Trong tương lai, các tác giả phần mềm hy vọng sẽ có thêm nhiều nhà khoa học ở cả trong vào ngoài nước tìm đến và sử dụng bayesvl.
R là ngôn ngữ lập trình và môi trường phần mềm hoàn toàn miễn phí
được thiết kế cho tính toán thống kê và đồ họa. Hiện nay, R được sử dụng
rộng rãi cho việc phát triển các phần mềm thống kê và phân tích dữ
liệu. Là ngôn ngữ lập trình mã nguồn mở, các tính năng cho R luôn được
mở rộng và cải thiện thông qua các gói phần mềm (package), thường là do
người dùng thiết kế và xây dựng. Các gói phần mềm này mở rộng thêm tính
năng thống kê hay sản xuất hình ảnh, phục vụ nhu cầu phức tạp và đa dạng
của người dùng. CRAN hay Comprehensive R Archive Network là thư viện lưu trữ, phân phối các phiên bản chính thức của R, hơn 15000 gói phần mềm, hay các phần code bổ sung cho R. Bên cạnh CRAN, người dùng còn có thể tìm kiếm thêm các gói phần mềm này trên các hệ thống lưu trữ khác như GitHub, Omegahat hay Bioconductor. |
**Bài viết được đăng trên báo Khoa học & Phát triển tại địa chỉ: http://khoahocphattrien.vn/khoa-hoc/chuong-trinh-may-tinh-bayesvl-trong-moi-truong-r-dong-gop-viet-cho-khoa-hoc-the-gioi/20190613093044113p1c160.htm
Hoàng Phương Hạnh (Viện Khoa học Giáo dục Việt Nam)
No comments:
Post a Comment