Empirical study of feature extraction approaches for image captioning in Vietnamese
Tác giả: Khang Nguyen
Số trang:
P. 327-346
Tên tạp chí:
Tin học & Điều khiển học
Số phát hành:
V.38-N.4
Kiểu tài liệu:
Tạp chí trong nước
Nơi lưu trữ:
03 Quang Trung
Mã phân loại:
005
Ngôn ngữ:
Tiếng Anh
Từ khóa:
Grid features, region features, image captioning, Viecap4h, uit-viic, faster R-CNN, cascade R-CNN, grid R-CNN, Vinvl
Chủ đề:
Computer science
Tóm tắt:
This study focus on the image captioning problem in Vietnamese. Indetail, an empirical study of grid-based and region-based feature extraction approaches using currentstate-of-the-art object detection methods is investigated to explore the suitable way to represent theimages in the model space. Each feature type represents images, and the image captioning task istrained using the Transformer-based model. The effectiveness of different feature types is exploredon two Vietnamese datasets: UIT-ViIC and VieCap4H, the two standard benchmark datasets. Theexperimental results show crucial insight into the feature extraction task for image captioning inVietnamese.
Tạp chí liên quan
- Đánh giá kết quả phẫu thuật Phaco điều trị bệnh đục thể thủy tinh trên mắt có hội chứng giả bong bao tại Bệnh viện 19-8
- Kết quả điều trị đau do zona bằng phương pháp giảm đau do người bệnh tự kiểm soát
- Tình trạng suy dinh dưỡng và các yếu tố liên quan ở người bệnh ung thư đường tiêu hóa đang hóa trị tại Bệnh viện Đại học Y Dược Thành phố Hồ Chí Minh
- Đánh giá kết quả của cấy chỉ kết hợp xoa bóp bấm huyệt, điện châm và thủy châm điều trị bệnh nhân thoái hóa khớp gối
- Đánh giá tác dụng của phương pháp laser châm kết hợp xoa bóp bấm huyệt điều trị đau vùng cổ gáy do thoái hóa cột sống cổ