Thư viện Đại học Duy Tân, Đà Nẵng, Việt Nam

CSDL Bài trích Báo - Tạp chí

Hiển thị Marc

Similarity algorithms for fuzzy join computation in big data processing environment

Tác giả: Anh Cang Phan, Thuong Cang Phan

Số trang: P. 101-124

Số phát hành: Tập 39 - Số 2

Kiểu tài liệu: Tạp chí trong nước

Nơi lưu trữ: 03 Quang Trung

Mã phân loại: 005

Ngôn ngữ: English

Từ khóa: Fuzzy joins, similarity algorithms, set-similarity joins, big data processing, spark

Chủ đề: Big data

Tóm tắt:

Currently, there is very little research on this issue, thus it poses significant barriers to the efforts of improving query operations on big data efficiently. As a result, this study overviews the similarity algorithms for fuzzy joins, in which the data at the join key attributes may have slight differences within a fuzzy threshold.

Tạp chí liên quan

So sánh hiệu quả của đặc trưng ngữ nghĩa PhoBERT và Naive Bayes trong phân loại chủ đề và đánh giá mức độ hài lòng từ bình luận của sinh viên
Phân tích hiệu năng phát hiện phương tiện bay không người lái bất hợp pháp
Cải tiến thuật toán Ant Colony giải quyết bài toán người bán hàng (TSP)
Phát hiện malware dựa trên header của tập tin Portable Executable sử dụng Machine Learning
Constrained optimization using swarm intelligence integrated with Deb’s feasibility rules developed in Python = Giải bài toán tối ưu hóa ràng buộc sử dụng trí tuệ bầy đàn kết hợp quy tắc khả thi của Deb được phát triển bằng Python

Bài báo Giảng viên DTU

Thư mục chuyên đề

CSDL Bài trích Báo - Tạp chí

Similarity algorithms for fuzzy join computation in big data processing environment

Tóm tắt: