QH1.0: Công cụ phân đoạn từ tiếng Việt dựa trên quá trình máy tự học và đo độ liên kết
Tác giả: Lê Anh Vũ, Lê Trung Hiếu, Võ Hoàng Hải
Số trang:
tr 128 - 137
Tên tạp chí:
Khoa học & Công nghệ
Số phát hành:
No.1 11/2011
Kiểu tài liệu:
Báo - Tạp chí
Nơi lưu trữ:
03 Quang Trung
Mã phân loại:
004
Ngôn ngữ:
Tiếng Việt
Từ khóa:
công cụ phân đoạn từ tiếng Việt, máy tự học , độ liên kết
Chủ đề:
Công cụ--Phân đoạn từ tiếng Việt
Tóm tắt:
QH1.0 là công cụ phát triển bởi nhóm tác giả nhằm giải quyết bài toán Phân đoạn từ tiếng Việt. Đây là một bước xử lý quan trọng cảu bài toán tổng quát Phân tích xử lý tự động tiếng Việt. QH1.0 dựa trên độ đo liên kết và quá trình máy tự học. Đặc điểm nổi bật của cách tiếp cận là hoàn toàn không sử dụng từ điển hay ngân hàng câu được phân đoạn, gán nhãn sẵn. Thuật toán xử lý số liệu hoàn toàn tự động dựa trên việc xử lý thống kê dữ liệu cực lớn.
Tạp chí liên quan
- Máy tính lượng tử, cơ hội và thách thức đối với an toàn an ninh
- Trắc nghiệm thích ứng trên máy tính: Giải pháp mới đánh giá năng lực thí sinh
- Khai thác dữ liệu trong bảo trì thiết bị
- Áp dụng mạng Bayes xây dựng mô hình dự đoán xác suất có điều kiện phức hợp = Applying Bayesian network to build predicting model for complex conditional probabilities
- Tăng tốc dựa vào GPU giải thuật phân lớp chuỗi thời gian gồm tổ hợp bộ phân lớp 1-NN kết hợp với những đô đo khoảng cách không đàn hồi và đàn hồi