QH1.0: Công cụ phân đoạn từ tiếng Việt dựa trên quá trình máy tự học và đo độ liên kết
Tác giả: Lê Anh Vũ, Lê Trung Hiếu, Võ Hoàng Hải
Số trang:
tr 128 - 137
Tên tạp chí:
Khoa học & Công nghệ
Số phát hành:
No.1 11/2011
Kiểu tài liệu:
Báo - Tạp chí
Nơi lưu trữ:
03 Quang Trung
Mã phân loại:
004
Ngôn ngữ:
Tiếng Việt
Từ khóa:
công cụ phân đoạn từ tiếng Việt, máy tự học , độ liên kết
Chủ đề:
Công cụ--Phân đoạn từ tiếng Việt
Tóm tắt:
QH1.0 là công cụ phát triển bởi nhóm tác giả nhằm giải quyết bài toán Phân đoạn từ tiếng Việt. Đây là một bước xử lý quan trọng cảu bài toán tổng quát Phân tích xử lý tự động tiếng Việt. QH1.0 dựa trên độ đo liên kết và quá trình máy tự học. Đặc điểm nổi bật của cách tiếp cận là hoàn toàn không sử dụng từ điển hay ngân hàng câu được phân đoạn, gán nhãn sẵn. Thuật toán xử lý số liệu hoàn toàn tự động dựa trên việc xử lý thống kê dữ liệu cực lớn.
Tạp chí liên quan
- Mức độ ảnh hưởng của các yếu tố gây khó khăn trong việc học kĩ năng nghe của sinh viên không chuyên tiếng Anh tại Trường Đại học Công nghiệp Hà Nội
- Phương pháp thuyết trình tiếng Nhật và hiệu quả trong học tập tiếng Nhật của sinh viên ngành ngôn ngữ Nhật
- Tìm hiểu một số lỗi ngứ pháp tiếng Việt của sinh viên Trung Quốc qua các bài viết luận
- Sự chuyển hóa ý nghĩa của từ vị giác 咸 (hàm) trong tiếng Hán và “mặn” trong tiếng Việt
- Đặc trưng văn hóa – dân tộc của thành ngữ Tày có các thành tố chỉ bộ phận cơ thể biểu thị trí tuệ của con người