A new information theory based algorithm for clustering categorical data
Tác giả: Do Si Truong, Lam Thanh Hien, Nguyen Thanh TungTóm tắt:
In this paper, we review two baseline algorithms for use with categorical data, namely Min-Min Roughness (MMR) and Mean Gain Ratio (MGR), and propose a new algorithm, called Minimum Mean Normalized Variation of Information (MMNVI). MMNVI algorithm uses the Mean Normalized Variation of Information of one attribute concerning another for finding the best clustering attribute, and the entropy of equivalence classes generated by the selected clustering attribute for binary splitting the clustering dataset. Experimental results on real datasets from UCI indicate that the MMNVI algorithm can be used successfully in clustering categorical data. It produces better or equivalent clustering results than the baseline algorithms.
- Solving constrained optimization tasks in civil engineering using ε- Differential Evolution developed with Visual C#. NET = Giải các bài toán tối ưu hóa có ràng buộc trong ngành xây dựng sử dụng thuật toán ε - tiến hóa vi phân được phát triển với ngôn ngữ
- Optimizing cantilever retaining wall design using feasibility rule-based evolutionary algorithm developed with Visual C# .NET = Tối ưu hóa thiết kế tường chắn đất sử dụng thuật toán tiến hóa được kết hợp quy tắc khả thi và phát triển với ngôn ngữ C# .NET
- IFC5 : kỳ vọng về cuộc cách mạng trao đổi thông tin trong xây dựng kỹ thuật số
- Ứng dụng công nghệ chuỗi khối trong nghiệp vụ ngân hàng tại Việt Nam: Thực trạng và khuyến nghị
- Mô hình học sâu phát hiện và nhận diện mã container áp dụng trong vận hành cảng thông minh





