A new information theory based algorithm for clustering categorical data
Tác giả: Do Si Truong, Lam Thanh Hien, Nguyen Thanh TungTóm tắt:
In this paper, we review two baseline algorithms for use with categorical data, namely Min-Min Roughness (MMR) and Mean Gain Ratio (MGR), and propose a new algorithm, called Minimum Mean Normalized Variation of Information (MMNVI). MMNVI algorithm uses the Mean Normalized Variation of Information of one attribute concerning another for finding the best clustering attribute, and the entropy of equivalence classes generated by the selected clustering attribute for binary splitting the clustering dataset. Experimental results on real datasets from UCI indicate that the MMNVI algorithm can be used successfully in clustering categorical data. It produces better or equivalent clustering results than the baseline algorithms.
- Đánh giá nguy cơ ngã của người bệnh viêm khớp dạng thấp bằng thang điểm morse tại Bệnh viện Đại học Y Hà Nội
- Thực trạng lo âu và một số yếu tố liên quan ở người bệnh đến tiêm và hút dịch khớp tại Bệnh viện Đại học Y Hà Nội
- Đặc điểm hình thái tuyến giáp trên siêu âm ở phụ nữ sau mãn kinh
- Bước đầu đánh giá kết quả điều trị tắc động mạch phổi cấp ở bệnh nhân cao tuổi
- Thực trạng và kết quả điều trị thiếu máu ở người bệnh phẫu thuật chỉnh hình lớn tại Bệnh viện Đại học Y Hà Nội giai đoạn 2023-2024