CSDL Bài trích Báo - Tạp chí

chủ đề: Khai phá dữ liệu

  • Duyệt theo:
1 Thuật toán khai thác tập hữu ích cao dựa trên di truyền với đột biến xếp hạng / Phạm Đức Thành, Lê Thị Minh Nguyện // .- 2022 .- Volume 7 (N 2) - Tháng 9 .- Tr. 67 - 81 .- 005

Khai thác độ hữu ích là nghiên cứu khai thác tập mục có lợi từ cơ sở dữ liệu giao dịch. Đây là phương pháp khai thác tập phổ biến dựa trên độ hữu ích để tìm tập mục phù hợp với sở thích của người dùng. Những nghiên cứu gần đây về khai thác các tập mục hữu ích cao (HUIs) từ cơ sở dữ liệu (CSDL) phải đối mặt với hai thách thức lớn, đó là không gian tìm kiếm theo cấp số nhân và ngưỡng hữu ích tối thiểu phụ thuộc vào CSDL. Không gian tìm kiếm vô cùng lớn khi số lượng các mục riêng biệt và kích thước của CSDL lớn. Các nhà phân tích phải chỉ định các ngưỡng hữu ích tối thiểu để phù hợp với những công việc khai thác của họ, mặc dù có thể họ không có kiến thức liên quan đến CSDL mà họ đang làm. Hơn nữa, thuật toán khai thác độ hữu ích chỉ hỗ trợ tập mục mang giá trị dương. Để tránh những vấn đề này, bài viết rình bày hai cách tiếp cận để khai thác HUI có chứa mục giá trị âm từ CSDL giao dịch: có hoặc không có chỉ định ngưỡng hữu ích tối thiểu thông qua thuật giải di truyền với đột biến được xếp hạng. Theo sự tìm hiểu của chúng tôi, đây là nghiên cứu đầu tiên trong khai thác HUI với các giá trị mang mục âm từ CSDL giao dịch sử dụng thuật giải di truyền. Kết quả thử nghiệm cho thấy các phương pháp tiếp cận được mô tả trong bài viết này đạt được hiệu suất tốt hơn về khả năng mở rộng và tính hiệu quả.

2 Cải tiến thuật toán Hminer cho việc khai thác tập hữu ích cao trên dữ liệu thao tác thưa / Trần Minh Thái, Trần Anh Duy, Lê Thị Minh Nguyện // .- 2023 .- Volume 7 (N 3) - Tháng 3 .- Tr. 7 - 16 .- 005

Nghiên cứu và đề xuất phương pháp khai thác đối với tập dữ liệu thưa thông qua một số cách thức tổ chức dữ liệu và kỹ thuật cắt tỉa. Kết quả đánh giá thực nghiệm đã chứng tỏ được tính khả thi của giải pháp được đề xuất.

3 Ứng dụng khai thác mẫu tuần tự vào việc dự đoán xu hướng cổ phiếu / Trần Minh Thái, Nguyễn Tuấn Dũng // .- 2023 .- Volume 7 (N 3) - Tháng 3 .- Tr. 68 - 76 .- 005

Đề xuất mô hình sử dụng kỹ thuật khai thác dữ liệu áp dụng vào việc dự đoán xu hướng cổ phiếu. Mô hình dự đoán dựa vào thuật toán khai thác mẫu con tuần tự trên tập dữ liệu lịch sử cổ phiếu. Bên cạnh đó, kỹ thuật xác định mẫu con thông qua độ tương tự cũng được trình bày trong bài báo. Dữ liệu thực nghiệm được thu thập trên trang https://finance.yahoo.com. Kết quả thực nghiệm của mô hình được đề xuất có độ chính xác trung bình tốt hơn so với mô hình truyền thống như SVM và LSTM.

4 Ứng dụng của các kỹ thuật khai phá dữ liệu trong lĩnh vực ngân hàng / Nguyễn Phan Tình // .- 2023 .- Số 637 .- Tr.16-18 .- 332.04

Khai phá dữ liệu đã trở thành lĩnh vực chiến lược quan trọng đối với nhiều tổ chức kinh doanh trong đó có ngành ngân hàng. Nhờ vậy, hỗ trợ các ngân hàng trong việc tạo ra lợi thế cạnh tranh, duy trì khách hằng phát hiện và ngăn chặn gian lận, quản trị rủi ro... Bài viết này cung cấp khái niệm tổng quan về khai phá dữ liệu và nêu bật các ứng dụng của khai phá dữ liệu nhằm nâng cao hiệu quả hoạt động của một số quy trình nghiệp vụ cốt lõi trong ngành ngân hàng.

5 Khai thác các tập mục hữu ích cao dựa trên phương pháp tối ưu bầy đàn dùng Bitmap / Phạm Đức Thành // Khoa học (Trường Đại học Ngoại ngữ - Tin học Thành phố Hồ Chí Minh) .- 2021 .- Số 6 .- Tr. 03-13 .- 005

Trong số các thuật toán tiến hóa trong tự nhiên được sử dụng để khai thác HUIs, thuật toán tối ưu bầy đàn (PSO) là phổ biến nhất. PSO khai thác HUI dựa trên sự chuyển đổi vị trí không ngừng theo hàm sigmoid cho vận tốc. Trong bài báo này, đề xuất một thuật toán HUIM dựa trên bộ PSO (S-PSO) được goi là HUIM-SPSO, trong đó chủ yếu xem xét các phần tử ở các vị trí có vận tốc lớn. Thực hiện mô hình hóa HUIM bằng S-PSO và giải thích HUIM-SPSO một cách chi tiết. Để phản ánh được sự đa dạng của các kết quả khai thác, đề xuất thước đo bit để chỉnh sửa khoảng cách. Kết quả thực nghiệm cho thấy thuật toán HUIM-SPSO hiệu quả và có thể khám phá nhiều HUI hơn với mức độ đa dạng cao.

6 Tăng tốc kết chuỗi con với độ đo xoắn thời gian động dựa vào sự hỗ trợ của GPU / Trường An Lâm, Tuấn Anh Dương // Khoa học (Trường Đại học Ngoại ngữ - Tin học Thành phố Hồ Chí Minh) .- 2021 .- Số 6 .- Tr. 67-77 .- 005

Kết chuỗi con trên chuỗi thời gian là một trong những bài toán khai phá dữ liệu chuỗi thời gian quan trọng. Trong nghiên cứu này, sử dụng một giải thuật kết chuỗi con hữu hiệu, có tên EP-M, mà dựa vào độ đo xoắn thời gian động (dynamic time warping - DTW) và phân đoạn chuỗi thời gian. Do tính hiệu quả cao của độ đo DTW so với các độ đo khoảng cách khác, đã có nhiều nỗ lực trong cộng đồng nghiên cứu nhằm khắc phục tình trạng chi phí tính toán cao của độ đo DTW. Các kỹ thuật phần mềm để tăng tốc việc tính toán độ đo DTW trong khai phá chuỗi thời gian gồm có các kỹ thuật từ bỏ sớm, cắt tỉa dựa vào cận dưới và lập chỉ mục. Trong nghiên cứu này, thiết kế và đánh giá một giải pháp dựa vào phần cứng, đó là đơn vị xử lý đồ họa (Graphics Processing Unit -GPU) để tăng tốc giải thuật kết chuỗi con EP-M bằng cách song song hóa. Kết quả thực nghiệm trên một số bộ dữ liệu mẫu cho thấy tính hữu hiệu cao của phương pháp dựa vào GPU đề xuất cho công tác kết chuỗi con trên chuỗi thời gian.

7 Khai phá trí tuệ Marketing trong thời đại dữ liệu lớn / Đàm Nguyễn Anh Khoa, Nguyễn Văn Kỳ Long // Kinh tế & phát triển .- 2020 .- Số 275 .- Tr. 58-66 .- 658.8

Để sinh tồn và phát triển trong thời đại công nghệ ngày nay, chuyển đổi số là xu hướng tất yếu của mọi doanh nghiệp. Trong tiến trình này, xu thế khai thác trí tuệ marketing từ dữ liệu lớn là chìa khoá sống còn của doanh nghiệp. Việc ứng dụng các kỹ thuật khai phá dữ liệu để chuyển đổi dữ liệu lớn thành trí tuệ marketing giúp doanh nghiệp nâng cao hiểu biết về thị trường, khách hàng, sản phẩm và đối thủ cạnh tranh. Tuy nhiên, các nghiên cứu trước đây còn bỏ ngỏ vấn đề này, đặc biệt là việc ứng dụng các mô hình và kỹ thuật khai phá dữ liệu. Do đó, nghiên cứu này trình bày tổng quan các nghiên cứu về trí tuệ marketing trong thời đại dữ liệu lớn thông qua việc ứng dụng các mô hình và công cụ khai phá dữ liệu. Kết quả nghiên cứu đề xuất các mô hình, kỹ thuật khai phá dữ liệu cho từng thành phần của trí tuệ marketing. Bài viết này cũng đề xuất các hướng nghiên cứu khả thi trong tương lai.

8 Đề xuất các phương pháp phân cụm dữ liệu mờ cho khai phá dữ liệu không gian / Hoàng Anh Đức // Tài nguyên & Môi trường .- 2018 .- Số 10 (288) .- Tr. 28 – 30 .- 005

Tóm tắt về các phương pháp khai thác dữ liệu được sử dụng để phân cụm thông tin trong dữ liệu không gian cho các mục đích khác nhau.Tóm tắt các công trình khác nhau cũng đã được thực hiện để cho phép người đọc lựa chọn sử dụng các công cụ khác nhau tùy thuộc vào yêu cầu và ứng dụng của họ trong khai phá dữ liệu không gian.