Similarity algorithms for fuzzy join computation in big data processing environment
Tác giả: Anh Cang Phan, Thuong Cang Phan
Số trang:
P. 101-124
Số phát hành:
Tập 39 - Số 2
Kiểu tài liệu:
Tạp chí trong nước
Nơi lưu trữ:
03 Quang Trung
Mã phân loại:
005
Ngôn ngữ:
English
Từ khóa:
Fuzzy joins, similarity algorithms, set-similarity joins, big data processing, spark
Chủ đề:
Big data
Tóm tắt:
Currently, there is very little research on this issue, thus it poses significant barriers to the efforts of improving query operations on big data efficiently. As a result, this study overviews the similarity algorithms for fuzzy joins, in which the data at the join key attributes may have slight differences within a fuzzy threshold.
Tạp chí liên quan
- Thiết kế đô thị vì sức khỏe cộng đồng
- Nghiên cứu các yếu tố hấp dẫn đô thị : lấy TP. HCM làm nghiên cứu điển hình
- Nghiên cứu thực nghiệm xác định áp lực sóng xung kích trên bề mặt đất do 2 lượng nổ liên tiếp trong không khí
- Sử dụng lý thuyết biến dạng cắt tính toán động lực học của dầm bê tông cốt thanh composite aramid trên nền đàn hồi chịu tác dụng của hệ dao động di động
- Kinh nghiệm phát triển kinh tế số của một số quốc gia Đông Á và bài học tham khảo cho Việt Nam