Sử dụng hai ngưỡng khai thác tập có thể xóa trên dữ liệu tăng cường
Tác giả: Nguyễn Linh Hoài ThịTóm tắt:
Khai thác dữ liệu truyền thống thường được áp dụng trên các cơ sở dữ liệu (CSDL) tĩnh và xử lý theo lô. Trên thực tế, CSDL thường xuyên biến động, việc xử lý theo lô không hiệu quả gây lãng phí khi một lượng nhỏ dữ liệu được thêm vào nhưng phải khai thác lại từ đầu. Vì vậy, khai thác dữ liệu trên cơ sở dữ liệu động đã thu hút sự nghiên cứu của nhiều tác giả. Trong đó, khai thác tập có thể xoá (EIs) trên cơ sở dữ liệu tăng cường là một trong những lĩnh vực thú vị. Mặc dù gần đây cũng đã có một vài công trình được phát triển để xử lý việc cập nhật EIs trên cơ sở dữ động nhưng hạn chế chính là xác suất quét lại CSDL lớn dẫn đến tốn nhiều thời gian cập nhật. Trong bài báo này chúng tôi đề xuất một thuật toán cập nhật EIs sử dụng hai ngưỡng để tránh việc quét lại nhiều lần CSDL gốc cũng như sử dụng các cấu trúc dữ liệu mới để xử lý dữ liệu tăng cường hiệu quả.
- Chất lượng cuộc sống của người bệnh sau phẫu thuật thay khớp gối toàn phần tại Bệnh viện Hữu nghị Việt Đức năm 2025
- Đặc điểm dịch tễ học, lâm sàng, thực trạng sơ cứu và xử trí ban đầu bệnh nhân rắn độc cắn tại Bệnh viện Hữu nghị Đa khoa Nghệ An
- Giá trị của thang điểm Rajan's Heart Failure (R-hf) trong tiên lượng kết cục ngắn hạn ở bệnh nhân suy tim mất bù cấp
- Đánh giá chức năng gan và thận ở bệnh nhân HIV điều trị ARV tại Bệnh viện Thành phố Thủ Đức trong giai đoạn 2023-2024 và các yếu tố liên quan
- Tỷ lệ mắc và một số nguyên nhân gây tổn thương thận cấp ở trẻ sơ sinh tại trung tâm sơ sinh, Bệnh viện Nhi Trung ương