Empirical study of feature extraction approaches for image captioning in Vietnamese
Tác giả: Khang Nguyen
Số trang:
P. 327-346
Tên tạp chí:
Tin học & Điều khiển học
Số phát hành:
V.38-N.4
Kiểu tài liệu:
Tạp chí trong nước
Nơi lưu trữ:
03 Quang Trung
Mã phân loại:
005
Ngôn ngữ:
Tiếng Anh
Từ khóa:
Grid features, region features, image captioning, Viecap4h, uit-viic, faster R-CNN, cascade R-CNN, grid R-CNN, Vinvl
Chủ đề:
Computer science
Tóm tắt:
This study focus on the image captioning problem in Vietnamese. Indetail, an empirical study of grid-based and region-based feature extraction approaches using currentstate-of-the-art object detection methods is investigated to explore the suitable way to represent theimages in the model space. Each feature type represents images, and the image captioning task istrained using the Transformer-based model. The effectiveness of different feature types is exploredon two Vietnamese datasets: UIT-ViIC and VieCap4H, the two standard benchmark datasets. Theexperimental results show crucial insight into the feature extraction task for image captioning inVietnamese.
Tạp chí liên quan
- Đáp ứng di truyền học phân tử sâu trên người bệnh bạch cầu mạn dòng tủy kháng hoặc không dung nạp imatinib được điều trị
- Đánh giá hiệu quả của phác đồ hóa trị kết hợp Epirubicin và nhóm Taxanes trong điều trị hóa trị tân bổ trợ ung thư vú giai đoạn III có thụ thể HER2 dương tính
- Ảnh hưởng của các chỉ số huyết học trước gạn tách đến quá trình gạn tách và chất lượng khối tiểu cầu trên hệ thống có lọc bạch cầu và bù dịch tại trung tâm Truyền máu Chợ Rẫy
- Chất lượng khối tế bào gốc máu ngoại vi sau bảo quản đông lạnh tại Ngân hàng tế bào gốc - Viện Huyết học – Truyền máu Trung ương giai đoạn 2014 – 2023
- Bước đầu đánh giá tính an toàn và hiệu quả của liệu pháp tế tế bào đơn nhân tủy xương tự thân ở bệnh nhân đột quỵ nhồi máu não





