Bước đầu xây dựng tự động kho ngữ liệu song song thơ ca chữ Hán của Việt Nam có bản dịch nghĩa tiếng Việt hiện đại
Tác giả: Thái Hoàng Lâm, Dương Thị An, Đinh Điền
Số trang:
Tr. 3-13
Số phát hành:
Số 12 (398)
Kiểu tài liệu:
Tạp chí trong nước
Nơi lưu trữ:
03 Quang Trung
Mã phân loại:
495.1
Ngôn ngữ:
Tiếng Việt
Từ khóa:
Ngữ liệu, thơ, chữ Hán, dịch nghĩa, tiếng Việt
Chủ đề:
Tiếng Việt
&
Chữ Hán
Tóm tắt:
Đề xuất phương pháp xây dựng tự động kho ngữ liệu thơ ca chữ Hán – bản dịch nghĩa tiếng Việt hiện đại với tỉ lệ thu thập thành công hơn 80%, số lượng trang web có nội dung cần sưu tập. Xây dựng tự động kho ngữ liệu song song văn bản chữ Hán – bản dịch nghĩa tiếng Việt ở lĩnh vực thơ ca chữ Hán của Việt Nam với hơn 4.000 bài thơ. Thống kê kho ngữ liệu theo số dòng thơ, tác giả, thời kì và thể loại. Điều này góp phần cho công tác khai thác kho ngữ liệu ở các nghiên cứu tiếp theo được thuận tiện hơn.
Tạp chí liên quan
- Thu thập tự dộng các dị thể chữ Hán – Nôm để cải thiện chất lượng chuyển tự động từ chữ môn sang chữ Quốc Ngữ
- Bàn về chiết tự chữ Hán trong câu đố tiếng Việt
- Lục Thư – Bốn phương pháp tạo chữ và hai cách dùng chữ Hán
- Khảo sát nghĩa của nhóm chữ Hán có chứa 酉 làm thành tố biểu ý
- Chiết tự và lược sử nghiên cứu về chiết tự chữ Hán