A new information theory based algorithm for clustering categorical data
Tác giả: Do Si Truong, Lam Thanh Hien, Nguyen Thanh TungTóm tắt:
In this paper, we review two baseline algorithms for use with categorical data, namely Min-Min Roughness (MMR) and Mean Gain Ratio (MGR), and propose a new algorithm, called Minimum Mean Normalized Variation of Information (MMNVI). MMNVI algorithm uses the Mean Normalized Variation of Information of one attribute concerning another for finding the best clustering attribute, and the entropy of equivalence classes generated by the selected clustering attribute for binary splitting the clustering dataset. Experimental results on real datasets from UCI indicate that the MMNVI algorithm can be used successfully in clustering categorical data. It produces better or equivalent clustering results than the baseline algorithms.
- Đánh giá kết quả phẫu thuật Phaco điều trị bệnh đục thể thủy tinh trên mắt có hội chứng giả bong bao tại Bệnh viện 19-8
- Kết quả điều trị đau do zona bằng phương pháp giảm đau do người bệnh tự kiểm soát
- Tình trạng suy dinh dưỡng và các yếu tố liên quan ở người bệnh ung thư đường tiêu hóa đang hóa trị tại Bệnh viện Đại học Y Dược Thành phố Hồ Chí Minh
- Đánh giá kết quả của cấy chỉ kết hợp xoa bóp bấm huyệt, điện châm và thủy châm điều trị bệnh nhân thoái hóa khớp gối
- Đánh giá tác dụng của phương pháp laser châm kết hợp xoa bóp bấm huyệt điều trị đau vùng cổ gáy do thoái hóa cột sống cổ