Áp dụng xác suất thống kê và quá trình máy tự học cho bài toán phân tách từ văn bản tiếng Việt
Tác giả: Lê Trung Hiếu, Lê Anh Vũ, Lê Trung KiênTóm tắt:
Trình bày hai vấn đề chính: Sử dụng mô hình xác suất nhận dạng và phân tách từ tiếng Việt; Áp dụng quá trình máy tự học xây dựng mô hình xác suất tối ưu. Với mỗi mô hình xác suất, từ mới được nhận dạng, các tiếng thuộc từ mới được nối tạo thành tiếng mới trong mô hình xác suất mới. Quá trình nối chuỗi các tiếng tạo thành tiếng mới làm giảm sự nhập nhằng giữa tiếng và từ trong tiếng Việt, tăng độ chính xác cho các hàm thống kê, tăng hiệu quả cho quá trình nhận dạng từ mới. Vì vậy, mô hình xác suất sẽ hội tụ về mô hình tối ưu. Quá trình thực nghiệm với 250.034 bài báo online, gồm hơn 15.000.000 câu tiếng Việt. Độ chính xác của thuật toán phân tách từ đạt trên 90%. Từ điển được xây dựng gồm hơn 100.000 từ và cụm từ tiếng Việt.
- Constrained optimization using swarm intelligence integrated with Deb’s feasibility rules developed in Python = Giải bài toán tối ưu hóa ràng buộc sử dụng trí tuệ bầy đàn kết hợp quy tắc khả thi của Deb được phát triển bằng Python
- Particle Swarm Optimization using ε constraint-handling method developed in Python = Thuật toán tối ưu hóa bầy đàn sử dụng phương pháp xử lý ràng buộc ε được phát triển với Python
- Solving constrained optimization tasks in civil engineering using ε- Differential Evolution developed with Visual C#. NET = Giải các bài toán tối ưu hóa có ràng buộc trong ngành xây dựng sử dụng thuật toán ε - tiến hóa vi phân được phát triển với ngôn ngữ
- Optimizing cantilever retaining wall design using feasibility rule-based evolutionary algorithm developed with Visual C# .NET = Tối ưu hóa thiết kế tường chắn đất sử dụng thuật toán tiến hóa được kết hợp quy tắc khả thi và phát triển với ngôn ngữ C# .NET
- IFC5 : kỳ vọng về cuộc cách mạng trao đổi thông tin trong xây dựng kỹ thuật số





