A new information theory based algorithm for clustering categorical data
Tác giả: Do Si Truong, Lam Thanh Hien, Nguyen Thanh TungTóm tắt:
In this paper, we review two baseline algorithms for use with categorical data, namely Min-Min Roughness (MMR) and Mean Gain Ratio (MGR), and propose a new algorithm, called Minimum Mean Normalized Variation of Information (MMNVI). MMNVI algorithm uses the Mean Normalized Variation of Information of one attribute concerning another for finding the best clustering attribute, and the entropy of equivalence classes generated by the selected clustering attribute for binary splitting the clustering dataset. Experimental results on real datasets from UCI indicate that the MMNVI algorithm can be used successfully in clustering categorical data. It produces better or equivalent clustering results than the baseline algorithms.
- Mối liên quan giữa một số đặc điểm lâm sàng và giải phẫu bệnh của sarcôm tạo xương với dấu ấn SATB2
- Đặc điểm mô bệnh học và hóa mô miễn dịch sarcoma màng hoạt dịch tại Bệnh viện K
- Nghiên cứu dấu hiệu lâm sàng và đặc điểm giải phẫu bệnh của bệnh viêm da cơ
- Đánh giá biểu hiện của thụ thể androgen trên bệnh ung thư vú bộ ba âm tính bằng phương pháp hóa mô miễn dịch
- Nghiên cứu đặc điểm hoá mô miễn dịch của EGFR và các dấu ấn CK, p63, Vimentin trong ung thư biểu mô vú dị sản tại Bệnh viện K





