Thuật toán khai thác tập hữu ích cao dựa trên di truyền với đột biến xếp hạng
Tác giả: Phạm Đức Thành, Lê Thị Minh NguyệnTóm tắt:
Khai thác độ hữu ích là nghiên cứu khai thác tập mục có lợi từ cơ sở dữ liệu giao dịch. Đây là phương pháp khai thác tập phổ biến dựa trên độ hữu ích để tìm tập mục phù hợp với sở thích của người dùng. Những nghiên cứu gần đây về khai thác các tập mục hữu ích cao (HUIs) từ cơ sở dữ liệu (CSDL) phải đối mặt với hai thách thức lớn, đó là không gian tìm kiếm theo cấp số nhân và ngưỡng hữu ích tối thiểu phụ thuộc vào CSDL. Không gian tìm kiếm vô cùng lớn khi số lượng các mục riêng biệt và kích thước của CSDL lớn. Các nhà phân tích phải chỉ định các ngưỡng hữu ích tối thiểu để phù hợp với những công việc khai thác của họ, mặc dù có thể họ không có kiến thức liên quan đến CSDL mà họ đang làm. Hơn nữa, thuật toán khai thác độ hữu ích chỉ hỗ trợ tập mục mang giá trị dương. Để tránh những vấn đề này, bài viết rình bày hai cách tiếp cận để khai thác HUI có chứa mục giá trị âm từ CSDL giao dịch: có hoặc không có chỉ định ngưỡng hữu ích tối thiểu thông qua thuật giải di truyền với đột biến được xếp hạng. Theo sự tìm hiểu của chúng tôi, đây là nghiên cứu đầu tiên trong khai thác HUI với các giá trị mang mục âm từ CSDL giao dịch sử dụng thuật giải di truyền. Kết quả thử nghiệm cho thấy các phương pháp tiếp cận được mô tả trong bài viết này đạt được hiệu suất tốt hơn về khả năng mở rộng và tính hiệu quả.
- Phân hạng nguy hiểm cháy và cháy nổ cho nhà sản xuất có nguy cơ nổ bụi tại Việt Nam
- Ảnh hưởng của đường quan hệ lực cắt - chuyển vị ngang của gối cách chấn đa lớp đến hiệu quả giảm chấn của nhà cách chấn đáy có kết cấu tường gạch
- Nâng cao hiệu quả nhận dạng các tham số dao động dựa trên kỹ thuật tách nguồn mù
- Ảnh hưởng của sườn đứng đến khả năng chịu nén đúng tâm của khối xây bằng gạch đất không nung
- Nguyên nhân phá hủy bề mặt gạch tháp Khương Mỹ và giải pháp hạn chế hư hỏng gạch phục chế, sử dụng gia cường khối xây tháp trong môi trường biển