Phân lớp dữ liệu mất cân bằng trong bài báo dự đoán thuê bao rời bỏ nhà mạng dựa vào giải thuật Rừng Ngẫu Nhiên cải tiến
Tác giả: Dương Tuấn Anh, Đinh Minh HòaTóm tắt:
Trong lãnh vực viễn thông, việc thuê bao rời bỏ nhà mạng là sự cố rất đáng quan tâm vì vấn đề này có thể ảnh hưởng đến lợi nhuận của công ty. Tuy nhiên, đặc điểm dữ liệu mất cân bằng trong bài toán dự đoán thuê bao rời bỏ nhà mạng gây khó khăn cho việc phát triển một mô hình phân lớp hiệu quả để giải quyết bài toán này. Trong nghiên cứu này thử áp dụng giải thuật rừng ngẫu nhiên có điều chỉnh hàm chi phí (cost-sensitive weighted random forest - CSWRF), vốn đã thành công trong bài toán phát hiện gian lận thẻ tín dụng (credit card fraud detection), để giải quyết vấn đề dữ liệu mất cân bằng trong bài toán dự đoán thuê bao rời bỏ nhà mạng. Ngoài ra, chúng tôi so sánh hiệu quả của giải thuật CSWRF với cách tiếp cận lấy mẫu dữ liệu: kết hợp giải thuật Rừng Ngẫu Nhiên với kỹ thuật lấy mẫu tăng SMOTE. Kết quả thực nghiệm trên hai bộ dữ liệu mẫu cho thấy đối với bài toán dự đoán thuê bao rời bỏ nhà mạng, vốn là bài toán mất cân bằng dữ liệu, hiệu quả phân lớp của giải thuật CSWRF thuộc cách tiếp cận điều chỉnh hàm chi phí (cost-sensitive learning) tốt hơn phương pháp SMOTE kết hợp giải thuật Rừng Ngẫu Nhiên.
- Constrained optimization using swarm intelligence integrated with Deb’s feasibility rules developed in Python = Giải bài toán tối ưu hóa ràng buộc sử dụng trí tuệ bầy đàn kết hợp quy tắc khả thi của Deb được phát triển bằng Python
- Particle Swarm Optimization using ε constraint-handling method developed in Python = Thuật toán tối ưu hóa bầy đàn sử dụng phương pháp xử lý ràng buộc ε được phát triển với Python
- Solving constrained optimization tasks in civil engineering using ε- Differential Evolution developed with Visual C#. NET = Giải các bài toán tối ưu hóa có ràng buộc trong ngành xây dựng sử dụng thuật toán ε - tiến hóa vi phân được phát triển với ngôn ngữ
- Optimizing cantilever retaining wall design using feasibility rule-based evolutionary algorithm developed with Visual C# .NET = Tối ưu hóa thiết kế tường chắn đất sử dụng thuật toán tiến hóa được kết hợp quy tắc khả thi và phát triển với ngôn ngữ C# .NET
- IFC5 : kỳ vọng về cuộc cách mạng trao đổi thông tin trong xây dựng kỹ thuật số





