Cuộc chiến dựng sẵn và tổ hợp

Năm 2001, khi tiêu chuẩn TCVN 6909:2001 do TS Đặng Minh Tuấn biên soạn dự thảo được ban hành, ít ai biết phía sau là cuộc chiến dai dẳng, căng thẳng giữa hai phương án: Dựng sẵn và tổ hợp.

Thời điểm ấy, sau khi Báo Quân đội nhân dân cùng hàng loạt tòa soạn lớn bắt đầu dùng bộ gõ tiếng Việt để thay thế xếp chữ chì, thì một rắc rối mới nảy sinh: Mỗi cơ quan, đơn vị lại chọn một kiểu bảng mã khác nhau. Trong khi đó, tiếng Việt vốn giàu dấu, nhiều biến thể, bảng mã 8 bit chỉ chứa 256 ký tự, phần nửa đã dành cho tiếng Anh. Phần còn lại không đủ chỗ, buộc người ta nghĩ ra đủ kiểu ghép dấu, tổ hợp phông. “Thời ấy, có đến 43 bảng mã tiếng Việt. Tài liệu từ nơi này gửi sang nơi kia là lỗi phông, mất chữ như cơm bữa. Đáng sợ nhất là cả quốc gia không thống nhất được tiếng nói số”, TS Đặng Minh Tuấn nhớ lại.

Nhưng để chuẩn hóa không dễ. Việt Nam đứng trước hai ngã rẽ: Một bên là phương án tổ hợp, do Microsoft và các tập đoàn công nghệ lớn hậu thuẫn, đưa ra giải pháp “chắp vá” dấu và chữ riêng biệt để tiết kiệm dung lượng mã. Còn lại là phương án dựng sẵn của Đặng Minh Tuấn, đơn giản, trực quan hơn, nhưng đi ngược với tư duy của người khổng lồ công nghệ.

leftcenterrightdel

TS Đặng Minh Tuấn giới thiệu sản phẩm mới, CMC AIVISION và CMC AIBOX. Ảnh: LIÊN HẢI 

Thời điểm đó, với nhiều người, Microsoft giống như tượng đài khổng lồ, đầy uy quyền và là chuẩn mực. Không ít chuyên gia, công ty công nghệ lớn của Việt Nam đều nghiêng về giải pháp tổ hợp, bởi nó “được Microsoft ủng hộ”. “Tôi nghĩ rằng, tiếng Việt cần được bảo vệ một cách độc lập. Nếu theo phương án tổ hợp của Microsoft, ta sẽ bị lệ thuộc hoàn toàn vào họ và với phương án tổ hợp tính tương thích trên các hệ điều hành khác như Linux, MacOS sẽ rất khó khăn hay thậm chí không thể hoạt động được”, TS Đặng Minh Tuấn hồi tưởng.

Lúc đó, cuộc tranh cãi đã kéo dài hơn nửa năm, đỉnh điểm là những bài “bút chiến” qua Tạp chí PC World. Cuối cùng, một cuộc tranh biện mở tại hội chợ công nghệ lớn Computer Expo ở TP Hồ Chí Minh được coi như là “trận cuối”. TS Đặng Minh Tuấn khi ấy chỉ có trong tay phần mềm Vietkey nhưng anh có lợi thế, Vietkey hỗ trợ cả dựng sẵn lẫn tổ hợp và chỉ ra những yếu điểm nếu phụ thuộc chuẩn tổ hợp. “Tôi nghĩ rằng tiếng Việt phải chạy được ở mọi môi trường, không thể để Microsoft nói gì ta cũng phải theo!”, anh Tuấn cho biết.

Tỷ lệ biểu quyết khi ấy là 93% chọn hướng đi dựng sẵn, mở đường cho tiêu chuẩn quốc gia TCVN 6909:2001 về bộ mã tiếng Việt ra đời. Sau đó, Quyết định số 72/2002/QĐ-TTg của Thủ tướng Chính phủ ban hành, quy định từ ngày 1-1-2003, mọi cơ quan nhà nước thống nhất dùng một chuẩn TCVN 6909:2001. Từ đó đến nay, tiếng Việt trên không gian số đã thực sự là tiếng Việt của người Việt, tự do, độc lập và thống nhất.

Bí mật từ những phép tính

Có những nhiệm vụ công nghệ được sinh ra giữa thời bình nhưng âm thầm mang theo gánh nặng của chiến tranh và trách nhiệm bảo vệ Tổ quốc. Đối với Đặng Minh Tuấn, một trong nhiều nhiệm vụ như thế chính là xây dựng phần mềm tính phần tử phóng cho tên lửa Scud.

Tên lửa Scud, vũ khí uy lực có trong biên chế của Quân đội ta, là biểu tượng sức mạnh quân sự thời Chiến tranh lạnh. Nhưng những chiếc máy tính dùng để tính toán các tham số phóng tên lửa dần hư hỏng, cũ kỹ theo năm tháng. Đứng trước vấn đề đó, Quân đội cần làm mới phần mềm để linh hoạt sử dụng trên máy tính hiện đại.

leftcenterrightdel
                  

Thủ tướng Chính phủ Phạm Minh Chính tham quan hệ sinh thái mở trí tuệ nhân tạo C.OpenAI (do TS Đặng Minh Tuấn và các cộng sự phát triển) tại lễ phát động phong trào cả nước thi đua đổi mới sáng tạo và chuyển đổi số, ngày 24-4-2025, tại Hà Nội. Ảnh: CMC ATI

Nhiệm vụ ấy được giao cho TS Đặng Minh Tuấn, lúc đó đang là Phó giám đốc Phòng thí nghiệm trọng điểm quốc gia về an toàn thông tin (ATTT), Viện Khoa học và Công nghệ quân sự. Đứng trước nhiệm vụ đặc biệt này, anh không tránh khỏi cảm giác hồi hộp xen lẫn lo lắng: “Tên lửa đạn đạo không giống như những thứ khác. Một sai số nhỏ cũng có thể gây hậu quả khôn lường. Tôi hiểu rõ điều đó và quyết tâm phải làm chính xác nhất có thể”.

Từ đây, TS Đặng Minh Tuấn lao vào nghiên cứu hàng loạt lý thuyết phức tạp về tên lửa, về quỹ đạo đạn đạo, các yếu tố khí hậu, gió, nhiệt độ và áp suất không khí. Những ngày tháng ấy, anh ngồi lặng lẽ bên máy tính suốt nhiều giờ. Sau hai năm kiên trì thử nghiệm, năm 2011, phần mềm tính phần tử phóng tên lửa Scud hoàn chỉnh cũng ra đời. Phần mềm ấy không chỉ phục hồi năng lực chiến đấu cho hệ thống tên lửa quan trọng của Quân đội mà còn giúp Việt Nam tháo bỏ những ràng buộc giới hạn trước đây về phạm vi tác chiến.

Không dừng lại ở Scud, anh còn làm tiếp phần mềm phần tử bắn cho pháo binh, áp dụng cho 18 loại pháo đạn đạo khác nhau. Rồi đến phần mềm đo đạc phục vụ xây dựng trận địa. Cùng với các đồng đội, TS Đặng Minh Tuấn còn tham gia chủ trì phần mềm quản lý cán bộ toàn quân, một “công cụ số” mà trong thời gian dài, tại nhiều cơ quan, cán bộ vẫn quen tay nhập dữ liệu chỉ bằng phím, không cần chuột, rồi phần mềm tác nghiệp trên nền bản đồ số (công cụ chuyển đổi số cho các phương án tác chiến)...

Xông xáo ở môi trường mới

Năm 2014, Đại tá, TS Đặng Minh Tuấn, Phó Giám đốc Trung tâm ATTT, Cục Công nghệ thông tin (nay thuộc Bộ tư lệnh 86, Bộ Quốc phòng) chuyển công tác sang Học viện Công nghệ Bưu chính Viễn thông. Năm 2018, anh được bổ nhiệm làm Viện trưởng Viện Nghiên cứu ứng dụng công nghệ CMC (CMC ATI), Tập đoàn Công nghệ CMC.

Tại đây, hàng loạt sản phẩm công nghệ đột phá lần lượt ra đời từ bàn tay, khối óc của anh và các cộng sự. Anh vui mừng thông báo với chúng tôi rằng, cách đây vài hôm, mô hình AI CATI-VLM (có khả năng phân tích và hiểu nội dung trong tài liệu ảnh theo cách trực quan) do Viện phát triển vừa được xếp hạng 12 thế giới tại cuộc thi Robust Reading Competition (RRC) 2025. Mô hình vượt qua nhiều sản phẩm của các tập đoàn công nghệ lớn như GPT-4 Vision Turbo kết hợp Amazon Textract OCR (hạng 34), hay Baidu (hạng 22). Hơn một năm trước, mô hình nhận dạng khuôn mặt FaceID của Viện CMC ATI cũng được xếp hạng tốp 12 thế giới và tốp 1 Việt Nam do Viện Tiêu chuẩn và Công nghệ Hoa Kỳ (NIST) đánh giá.

Viện hiện đang có trong tay hệ sinh thái về AI, với 25 công nghệ lõi, nhiều giải pháp có thứ hạng cao trên thế giới. Chiều 1-7 vừa qua, Cục Kiểm tra văn bản và Quản lý xử lý vi phạm hành chính, Bộ Tư pháp đã tổ chức buổi hướng dẫn sử dụng các chức năng phần mềm Trợ lý ảo rà soát văn bản quy phạm pháp luật (Trợ lý ảo CLS) nhằm hỗ trợ công tác chuyên môn của các đơn vị thuộc Bộ. Đây cũng là sản phẩm của Viện CMC ATI do TS Đặng Minh Tuấn dẫn dắt và các cộng sự phát triển trong hai năm qua. Những trang văn bản pháp luật chồng chéo, mâu thuẫn nhau suốt nhiều năm trời được phần mềm bóc tách, sắp xếp lại; hàng triệu dữ liệu phức tạp được xử lý chỉ trong tích tắc thay vì mất hàng tháng trời. Công cụ này hỗ trợ đắc lực cho việc giải quyết điểm nghẽn trong xây dựng thể chế. TS Đặng Minh Tuấn cũng là chủ nhiệm nhiều đề tài khoa học cấp nhà nước, cấp bộ. Các đề tài đều được Bộ Khoa học và Công nghệ, Bộ Quốc phòng đánh giá cao về tính khoa học và tính ứng dụng.

Năm 2024, TS Đặng Minh Tuấn được bổ nhiệm làm Trưởng khoa Vi điện tử và Viễn thông, Trường Đại học CMC (bên cạnh chức vụ Viện trưởng Viện CMC ATI). Đây là lĩnh vực anh ước mơ từ xưa, làm về thiết kế chip bán dẫn. "Tôi có thêm điều kiện hiện thực hóa ấp ủ bấy lâu là thiết kế chip AI tại biên và chip bảo mật do Việt Nam làm chủ hoàn toàn, không phụ thuộc vào chip nước ngoài ở những lĩnh vực trọng yếu". Thật vậy, năm ngoái, Viện CMC ATI đã thiết kế thành công và ra mắt hai sản phẩm phần cứng: AI Camera và AI Box (có cấu hình thuộc nhóm mạnh nhất trên thị trường).

Suốt mấy chục năm làm công nghệ, hành trình của TS Đặng Minh Tuấn chính là cuộc hành quân trường kỳ vì đất nước. Trên bước đường ấy, trong sâu thẳm trái tim anh, người chiến sĩ "Bộ đội Cụ Hồ" vẫn đang lặng lẽ cống hiến bằng niềm say mê, trách nhiệm và lòng yêu nước cháy bỏng chưa bao giờ ngưng nghỉ.

HẢI ANH