Trích rút quan hệ giữa các thực thể từ văn bản tiếng Việt sử dụng phương pháp lan truyền nhãn
Tác giả: Lê Thanh Hương, Sam Chanrathany, Nguyễn Thanh Thủy, Nguyễn Thành Long, Trịnh Minh Dũng
Số trang:
Tr. 15-27.
Tên tạp chí:
Tin học và Điều khiển học
Số phát hành:
Số 1 (T.30)/2014
Kiểu tài liệu:
Tạp chí trong nước
Nơi lưu trữ:
03 Quang Trung
Mã phân loại:
004
Ngôn ngữ:
Tiếng Việt
Từ khóa:
Trích rút mối quan hệ, lan truyền nhãn, học bán giám sát.
Chủ đề:
Dữ liệu số
Tóm tắt:
Đề xuất việc xây dựng hệ thống trích rút quan hệ giữa các thực thể từ văn bản tiếng Việt sử dụng phương pháp lan truyền nhãn. Các đóng góp chính là: đề xuất các phương pháp đo độ tương đồng giữa các câu; đề xuất phương pháp giảm ảnh hưởng của các nhãn có tần suất xuất hiện lớn đến quá trình lan truyền nhãn. Thử nghiệm cho thấy phương pháp giảm ảnh hưởng của các nhãn có tần suất xuất hiện lớn cho kết quả tốt hơn đáng kể phương pháp lan truyền nhãn gốc. Ngoài ra, khi sử dụng cùng dữ liệu huấn luyện nhỏ phương pháp lan truyền nhãn tốt hơn phương pháp SVM.
Tạp chí liên quan
- Hiệu lực của Quyền Hiến định trong lĩnh vực luật tư: Xu thế nghiên cứu trên thế giới và triển vọng ở Việt Nam
- Hoàn thiện pháp luật xử phạt vi phạm hành chính đối với hành vi buôn bán hàng hóa giả mạo nhãn hiệu
- Cảm thức sinh thái trong thơ chữ Hán Việt Nam và Hàn Quốc
- Mờ hóa nhân vật trong Mù lòa của José Saramago và Thành phố bị kết án biến mất của Trần Trọng Vũ từ góc nhìn văn học so sánh
- Bài thơ Tiếng Việt của Lưu Quang Vũ nhìn từ góc độ cấu trúc văn bản