A new information theory based algorithm for clustering categorical data
Tác giả: Do Si Truong, Lam Thanh Hien, Nguyen Thanh TungTóm tắt:
In this paper, we review two baseline algorithms for use with categorical data, namely Min-Min Roughness (MMR) and Mean Gain Ratio (MGR), and propose a new algorithm, called Minimum Mean Normalized Variation of Information (MMNVI). MMNVI algorithm uses the Mean Normalized Variation of Information of one attribute concerning another for finding the best clustering attribute, and the entropy of equivalence classes generated by the selected clustering attribute for binary splitting the clustering dataset. Experimental results on real datasets from UCI indicate that the MMNVI algorithm can be used successfully in clustering categorical data. It produces better or equivalent clustering results than the baseline algorithms.
- Kết quả điều trị tổn thương thần kinh quay đoạn cánh tay do chấn thương bằng kỹ thuật vi phẫu
- Tỷ lệ, đặc điểm lâm sàng, cận lâm sàng trẻ sơ sinh non tháng thiếu máu tại Bệnh viện Sản Nhi Ninh Bình năm 2025
- Kết quả giảm đau sớm của chườm lạnh kết hợp với phương pháp giảm đau tự kiểm soát trên người bệnh thay khớp háng
- Kĩ thuật bơm bóng động mạch chủ trong can thiệp nội mạch ở người bệnh phình động mạch chủ bụng vỡ tại Viện Tim mạch Việt Nam
- Viêm não tự miễn do kháng thể kháng thụ thể nmda tái phát nhiều lần ở trẻ em : một báo cáo ca bệnh





