❈ Đề mục

🌞 ⎯ Lời tri ân

🌒 — 04/2024・Âm tiết tiếng Việt là một kho dữ liệu khổng lồ

🌓 ⎯ 06/2024・ Fellowship Dự Án Tiếng Việt

🌔 ⎯ 09/2024 ・ Từ cảm tình thành tác phẩm

🌕 ⎯ 09/2024 ・ Buổi trưng bày Dự Án Tiếng Việt

🌚 ⎯ Hẹn ngày tái ngộ


🌞 ⎯ Trước hết, Lướt Code gửi lời tri ân tới

Dự án này được thực hiện bởi

IMG_3680.HEIC


Tiếng Việt hình thành từ khi chúng ta gọi nhau trong rừng sâu hang thẳm. Trải qua bao thời lập nước, xây đắp kinh thành, mở rộng bờ cõi đến nơi cồn cát xô ra biển cuộn, nơi ngập mặn u minh buốt xương, nơi đại ngàn trùng điệp dẫn lên đỉnh cao; tiếng Việt đã không chỉ còn nằm ở cái nôi nguyên thuỷ của nó. Ngày hôm nay, tiếng Việt là đại diện tiêu biểu trong ngữ hệ Nam Á, là ngôn ngữ chính thức của quốc gia trăm triệu dân và kiều bào. Thay đổi không chỉ còn nằm ở địa lý, mà còn ở nền tảng trao đổi. Từ những mai rùa, khúc xương, qua thời khắc đá, ghi giấy, viết thư, ghi âm, gọi điện thoại, nhắn tin rồi thành những dòng trạng thái khắp cõi mạng. Ngay tại lúc này, khi chúng ta đang chứng kiến vô vàn những truyền thống đang được/bị chắp thêm đôi cánh để bay lên hoà mình vào sự tân tiến của thời cuộc, thì tiếng Việt đã ở sẵn trên đấy từ khi nào rồi…

🌒 — 04/2024・Âm tiết tiếng Việt là một kho dữ liệu khổng lồ

Sự giàu đẹp của tiếng Việt

Được hình thành ở nơi sơn hải kề cạnh, giữa 2 khối văn hoá hùng cường Ấn Độ và Trung Hoa, trải qua sự chiếm đóng của 3 đế quốc Pháp, Mỹ, Nhật, tiếp thu kiến thức từ khối Liên Xô, trải qua 2 lần thay đổi văn tự, vốn từ vựng tiếng Việt có khả năng biểu đạt được khái niệm, hiện tượng, tâm tư, cảm xúc, tri thức của rộng rãi các dân tộc trên thế giới. Tiếng Việt giàu đẹp là vì lẽ đó.

Sự sinh thành của tiếng Việt vốn là một chủ đề mà các nhà khoa học nội ngoại dày công thu thập, đối chiếu, bàn luận và hệ thống. Không thể bỏ qua quyển An Nam Dịch Ngữ ở thế kỷ 16 đối chiếu 716 từ Hán Việt hay cuốn từ điển Việt-Bồ-Latinh của Alexander de Rhodes hợp thức hoá chữ Quốc ngữ. Không thể bỏ qua công sức André-Georges Haudricourt đã tìm hiểu về các từ nguyên của tiếng Việt, đối chất với công trình của học giả Đông phương Henry Maspero để chứng minh tiếng Việt thuộc nhóm Môn-Khmer của ngữ hệ Nam Á. Không thể bỏ qua giáo sư Nguyễn Tài Cẩn bàn về sự trù phú trong thanh điệu của tiếng Việt, từ những thiên tính của ngữ hệ Nam Á, cụ thể là nhánh Môn-Khmer đến sự tiếp thu thanh điệu của ngữ hệ Thái-Ka-đai. Và cũng không thể bỏ qua giáo sư Trần Trí Dõi đã dày công hệ thống sự trưởng thành của tiếng Việt trong bối cảnh văn hoá và lịch sử qua những thời kỳ đầy biến động.

Ngày nay, từ vựng tiếng Việt được hệ thống lại nhờ công trình từ điển tiếng Việt của cố giáo sư, nhà từ điển học Hoàng Phê. Các kho lưu trữ kỹ thuật số cũng đã mở rộng ra lãnh địa của chữ Nôm, các ngôn ngữ thuộc nhóm Môn-Khmer như từ điển Việt-Mường của Nguyễn Văn Khang chủ biên, ngữ vựng Katu của Nancy Costello, từ điển Cơ-ho-Pháp của Dournes Jacques xuất bản ở Sài Gòn. Rất nhiều mối liên quan giữa tiếng Việt với cơ ngơi các ngôn ngữ khác, với tiếng Việt những thời kỳ khác, nhưng để thấy rõ thiên tính của tiếng Việt, chúng ta hãy cùng đi sâu vào từng tế bào của nó: âm tiết.

Từ điển Hoàng Phê, nguồn liệu cho nghiên cứu khởi đầu.

Từ điển Hoàng Phê, nguồn liệu cho nghiên cứu khởi đầu.

Tiếng Việt trong không gian công nghệ

Từ những ngày bắt đầu, công nghệ luôn mang tính thơ trong bản thân nó. Trong loạt bài tìm hiểu về tính queer trong công nghệ (A Queer History of Computing), tạp chí Rhizome có nhắc đến chương trình viết thư tình của Christopher Strachey như là một trong những tác phẩm khởi xướng của nghệ thuật điện toán (computational art).

image.png

Danh sách các tính từ trong máy làm thư tình.

Danh sách các tính từ trong máy làm thư tình.

Chương trình được viết trên một thuật toán sinh từ — viết thư từ việc sắp xếp chữ vào các biến thế của các cấu trúc câu định sẵn từ trước. Các từ được sử dụng mang hơi hướng văn học thời Victorian, chẳng hạn như những từ ngữ gọi nhau trìu mến — “honey”, “jewel”, hay “moppet”. Chiếc máy viết thư tình như là một cái thú chơi chữ, tỏ tình đầy ý tứ giữa Christopher và Alan Turing.

little record survives to document more than a passing relationship between these two men, but what remains is a surprisingly poetic attempt to play at the machine.” — Jacob Gaboury (Rhizome)

Trên dòng cảm hứng về tính thơ trong thực hành với công nghệ, chúng tôi suy ngẫm về tính thơ trong tiếng Việt. Tất cả đều bắt nguồn từ cái âm tiết. Tiếng Việt có sự uyển chuyển, linh hoạt, tượng thanh, tượng hình là do sự uyển chuyển, linh hoạt, tượng thanh, tượng hình của từng âm tiết tạo ra. Khác với các ngôn ngữ khác, tiếng Việt là ngôn ngữ đơn âm tiết. Mỗi âm người Việt ta phát ra đều gợi lên một cảm xúc, một hình ảnh nhất định. “đau” và “đớn” nghe đã thấy cắt da thịt. “trùng”, “điệp” nghe đã thấy đi hết ba ngọn núi bảy ngọn đồi.

Cái tính thơ đó ắt phải liên quan ít nhiều với từng âm trong tiếng Việt.

Trên cơ sở đó, cũng như Christopher, chúng tôi bắt đầu xem xét lại bộ chữ tiếng Việt, không phải từng từ mà là từng âm. Dựa trên nguồn dữ liệu có sẵn của từ điển Hoàng Phê, từ điển soha, và nguồn liệu có sẵn của nhóm nghiên cứu NLP underthesea, dự án tạo ra một kho từ điển âm tiết tiếng Việt cùng với bộ 3 bài nghiên cứu về tính âm trong các âm tiết đó.

Đây chính là khởi đầu của dự án, cũng như là bệ đỡ cho Dmarc Lê, Đông-Trúc, và thou phát triển các tác phẩm về tính thơ của tiếng Việt trong không gian công nghệ.

Cập nhật dự án số 1

Tổng quan về Âm tiết tiếng Việt và khởi tạo kho dữ liệu mở về âm tiết cho cộng đồng. Tổng hợp tất cả các âm có thể phát âm trong tiếng Việt và đối chiếu với từ điển, xem có bao nhiêu âm có nghĩa và tối nghĩa.

Tổng quan về Âm tiết tiếng Việt và khởi tạo kho dữ liệu mở về âm tiết cho cộng đồng. Tổng hợp tất cả các âm có thể phát âm trong tiếng Việt và đối chiếu với từ điển, xem có bao nhiêu âm có nghĩa và tối nghĩa.

Cập nhật dự án số 2

Đi sâu vào hiện tượng đơn âm tiết hoá và quy cách phát âm của tiếng Việt hiện đại qua ví dụ nói lái. Từ đó, thử thiết kế lại bàn phím tiếng Việt cấu thành từ âm tiết thay vì từng chữ cái.

Đi sâu vào hiện tượng đơn âm tiết hoá và quy cách phát âm của tiếng Việt hiện đại qua ví dụ nói lái. Từ đó, thử thiết kế lại bàn phím tiếng Việt cấu thành từ âm tiết thay vì từng chữ cái.

Cập nhật dự án số 3 (tạm kết)

Quan sát sự biến hoá của tiếng Việt thông qua tài liệu và ghi chép về các phụ âm kép và cách phát âm trong tiếng Việt trung đại.

Quan sát sự biến hoá của tiếng Việt thông qua tài liệu và ghi chép về các phụ âm kép và cách phát âm trong tiếng Việt trung đại.

Bàn phím âm tiết tiếng Việt

Bàn phím âm tiết tiếng Việt

Thực hành đọc từ điển và ghi chép

Chia sẻ của Yui khi đọc từ điển ngắn Phân loại theo thanh điệu

Nguồn liệu mở

Bạn có thể truy cập ✧ Nguồn dữ liệu về âm đơn tiếng Việt tại: https://github.com/luotcode/amtiettiengviet ✧ Demo bàn phím âm tiết tại: https://tiengviet.netlify.app/