CSDL Bài trích Báo - Tạp chí

chủ đề: Học máy

  • Duyệt theo:
1 Mức độ hiệu quả của các mô hình học máy tree-based trong phát hiện giao dịch gian lận thẻ tín dụng / Nguyễn Minh Nhật, Đào Lê Kiều Oanh // Thương mại .- 2024 .- Số 195 .- Tr. 57-71 .- 658

Nghiên cứu này tập trung vào việc đánh giá và so sánh hiệu quả của các mô hình học máy dựa trên cây (Tree-based machine learning models) trong việc dự báo gian lận thẻ tín dụng. Các mô hình được xét gồm Decision Tree, Random Forest, Gradient Boosting Machines (GBM) và Extreme Gradient Boosting (XGBoost). Bộ dữ liệu sử dụng cho nghiên cứu này bao gồm 568,630 giao dịch thẻ tín dụng, với các thuộc tính từ V1 đến V28 được biến đổi thông qua phân tích thành phần chính (PCA) để bảo vệ thông tin cá nhân. Nghiên cứu này sử dụng ma trận nhầm lẫn (Confusion Matrix) và các chỉ số đánh giá như Độ chính xác, Độ nhạy (Recall), Precision và F1 Score để đánh giá hiệu quả của mỗi mô hình. Kết quả cho thấy rằng Random Forest và XGBoost đều có hiệu suất ấn tượng, đặc biệt Random Forest cho thấy sự vượt trội hơn trong việc giảm thiểu báo động giả và phát hiện chính xác các giao dịch gian lận.

2 Ứng dụng học máy nhận dạng tướng đất đá khu vực bồn trũng An Châu / Doãn Ngọc San // Khoa học và công nghệ Việt Nam .- 2025 .- Số 01B .- Tr. 1 - 6 .- 004

Bồn trầm tích An Châu (bồn An Châu) là một cấu trúc địa chất kéo dài theo phương Tây Bắc - Đông Nam, phân bố ở vùng Đông Bắc Việt Nam. Bồn An Châu được cho là bồn có quy mô lớn và có tiềm năng dầu khí. Thực tế này cho thấy, nhiều khả năng sẽ phát hiện được các tích tụ dầu khí trong bồn An Châu thuộc địa phận của Việt Nam. Mặc dù tiềm năng dầu khí của bồn này được nhận định từ rất sớm, nhưng vì nhiều lý do mà cho đến nay công tác điều tra, khảo sát địa chất và thăm dò ở khu vực bồn An Châu còn rất sơ sài, chưa đáp ứng được các yêu cầu của công tác tìm kiếm - thăm dò dầu khí. Việc ứng dụng mô hình học máy (machine learning - ML) vào nhận dạng tướng đá là một phương pháp mới giúp giảm thiểu thời gian xử lý, tổng hợp cơ sở dữ liệu về cả số lượng và định dạng, phát hiện các mối quan hệ ẩn sâu giữa các lớp thông tin nhận dạng. Mục tiêu chính của nghiên cứu này là nhận dạng tướng đất đá khu vực bồn An Châu từ phần số liệu đầy đủ đã được huấn luyện bởi cấu trúc mạng cây quyết định (DT) kết hợp thuật toán gradient boosting (XGB) để đánh giá cấu trúc và xác định tiềm năng dầu khí khu vực này. Điều kiện tiên quyết để nâng cao độ chính xác của học máy là phải làm giàu cơ sở dữ liệu thông qua tích hợp số liệu địa chất - địa chấn và tính toán thêm các thuộc tính để xây dựng “mô hình học” - huấn luyện ML và sử dụng kết quả huấn luyện đó để nhận dạng tướng đất đá trong khu vực bồn An Châu.

3 Ứng dụng các thuật toán học máy xác định độ sâu sau nước nhảy trong kênh chữ nhật có xét đến ảnh hưởng của lực ma sát / Hồ Việt Hùng // .- 2025 .- Số 2 .- Tr. 172 - 186 .- 624

Độ sâu sau nước nhảy là một yếu tố quan trọng, ảnh hưởng rất lớn đến độ sâu và chiều dài của bể tiêu năng. Việc tính toán chính xác độ sâu này là rất cần thiết và có ý nghĩa thực tiễn cao. Do đó, nghiên cứu này đã thiết lập và đánh giá khả năng dự báo độ sâu sau nước nhảy của sáu mô hình học máy (ML), gồm có: Rừng cây ngẫu nhiên (Random Forest - RT), Tăng cường thích ứng (Adaptive Boosting – Ada), Tăng cường tốc độ (Cat Boosting – CB), Tăng cường độ dốc (Gradient Boosting - GB), Cây bổ sung (Extra Trees - ET) và Máy Vector hỗ trợ (Support Vector Machine – SVM). Trong nghiên cứu này, định lý π-Buckingham đã được sử dụng để tìm năm tham số không thứ nguyên làm đầu vào và đầu ra của mô hình. Kết quả nghiên cứu cho thấy, các mô hình ET, GB, SVR, Ada có xét đến ảnh hưởng của độ nhám và chiều rộng lòng dẫn, tính nhớt của chất lỏng, có sai số nhỏ hơn so với công thức Belanger (bỏ qua lực ma sát) và các công thức kinh nghiệm khác. Khi kiểm định, các mô hình này đều có hệ số Nash đạt trên 0,996. Mô hình ET cho kết quả tốt nhất, sau đó là GB, SVR, Ada, RF, CB, theo thứ tự giảm dần. Như vậy, có thể áp dụng mô hình ET để tính toán độ sâu sau nước nhảy trong kênh lăng trụ đáy bằng, mặt cắt chữ nhật