Vì sao tiếng Việt không cùng nguồn gốc với tiếng Hán?

Nguyễn Hải Hoành (Tia Sáng)

Mối quan hệ giữa tiếng Việt với tiếng Hán là mối quan tâm lớn xưa nay của người Việt và là đối tượng nghiên cứu của giới ngôn ngữ học Việt Nam cũng như quốc tế trong gần 150 năm nay. Nhiều kết quả nghiên cứu liên quan đã được công bố, trong đó có cuốn “Lịch sử ngôn ngữ người Việt”(1) của tác giả Trần Trí Dõi. Trong cuốn sách đó ông đã lý giải vì sao tiếng Việt không cùng nguồn gốc với tiếng Hán.

Giới khoa học Viện Nghiên cứu Hán Nôm tìm hiểu tư liệu Hán Nôm của Việt Nam tại Viện Viễn Đông Bác cổ (EFEO). Ảnh: Trung tâm tư liệu quốc gia I.

Thông thường khi nghiên cứu nguồn gốc của một ngôn ngữ, bao giờ người ta cũng trước hết định vị ngôn ngữ đó thuộc vào nhóm ngôn ngữ nào, nhánh ngôn ngữ nào, cuối cùng thuộc ngữ hệ nào. Hiểu đơn giản, ngữ hệ (họ ngôn ngữ, language family) là tên gọi chung một tập hợp các ngôn ngữ có cùng nguồn gốc; như vậy các ngôn ngữ khác ngữ hệ thì không có chung nguồn gốc. 

(Dictionarium Anamitico-Latinum, primitus inceptum ab illustrissimo P.J. Pigneaux, dein absolutum et ed. a J. L. Taberd. [With] Appendix. Ab ill. J.S. Theurel recogn (1877). Nguồn: Google Books )

Sách “Lịch sử ngôn ngữ người Việt” có nêu vấn đề mà linh mục J. S. Theurel từng đưa ra nhận xét “tiếng Việt phần lớn bắt nguồn từ tiếng Hán” – được ghi trong cuốn Dictionarium Anamitico – Latinum (Từ điển Annam-Latin) của Theurel, ấn hành tại Kẻ Sở năm 1877(2). Nhận xét này dựa trên chứng cớ hiển nhiên là trong tiếng Việt có rất nhiều từ gốc Hán và có một số hiện tượng ngữ pháp rất giống tiếng Hán, vì thế được một số người tán đồng, hình thành quan điểm cho rằng ngôn ngữ của người Việt có nguồn gốc từ tiếng Hán, tiếng Việt là một ngôn ngữ thuộc nhóm tiếng Hán của ngữ hệ Hán-Tạng (Sino-Tibetan), nghĩa là tiếng Việt, tiếng Hán có chung ngữ hệ, tức chung nguồn gốc. Từ đó suy ra người Việt có nguồn gốc ở phương Bắc, về sau di cư xuống miền Nam. Rốt cuộc vấn đề này có liên quan tới nguồn gốc dân tộc ta. 

Năm 1912, khoa học gia người Pháp ở Viện Viễn Đông Bác cổ Henri Maspéro (1883-1945) nhận định tiếng Việt có nguồn gốc nhóm tiếng Thái (Taic). Căn cứ vào những chứng cớ mới rất chi tiết và có tính hệ thống phần lớn về ngữ âm, dựa trên lập luận chặt chẽ, Maspero đưa ra những kết luận thuyết phục được giới ngôn ngữ học suốt nửa thế kỷ sau đó, thậm chí sang thế kỷ XXI vẫn có người ủng hộ. Hiện nay chúng ta biết, tiếng Thái thuộc ngữ hệ Tai-Kadai, khác với ngữ hệ của Hán ngữ, như vậy nghĩa là Maspesro cho rằng tiếng Việt không cùng nguồn gốc với tiếng Hán.

Sáng kiến phiên âm chữ Hán thành chữ Hán-Việt đã giúp người Việt thuận lợi tiếp nhận chữ Hán mà hoàn toàn không nói tiếng Hán, đồng thời làm cho kho ngữ vựng tiếng Việt có thể phát triển hầu như vô hạn. Đây là một thành tựu kiệt xuất về ngôn ngữ học của tổ tiên chúng ta.

Nhưng đến những năm 1953, 1954 và 1966, một nhà ngôn ngữ học người Pháp rất nổi tiếng là Andre-Georges Haudricourt (1911-1996) công bố mấy bài báo phản bác quan điểm nói trên, cho rằng tiếng Việt có nguồn gốc Môn-Khmer, thuộc ngữ hệ Nam Á (Austroasiatic), nghĩa là không cùng nguồn gốc với tiếng Thái hoặc tiếng Hán. Lập luận của Haudricourt rất vững chắc và có nhiều chứng minh đầy sức thuyết phục, được nhiều nhà ngôn ngữ học Việt Nam và nước ngoài tán thành.

Trong nghiên cứu, các học giả đều xem xét mối quan hệ đối ứng ngữ vựng giữa tiếng Việt với các ngôn ngữ đối chiếu và chia ngữ vựng làm hai lớp: chữ cơ bản và chữ văn hóa. “chữ cơ bản” là những ngữ vựng thông dụng nhất, như từ mô tả các bộ phận cơ thể con người (chân, tay, mắt, mũi), từ nhân xưng (bố, mẹ, con, tôi, tao, mày), tên các vật xung quanh (nhà, cửa, trời, đất, trăng, sao), số đếm (một, hai, ba), tên gia súc (chó, mèo, trâu, bò, lợn), nhu cầu sống (ăn, uống, bú, ỉa, đái), cảm nhận (đau, giận, vui, buồn), v.v…, là những chữ liên quan tới nguồn gốc con người, nguồn gốc ngôn ngữ, là những từ con trẻ nói được khi bắt đầu biết nói, chưa bị ảnh hưởng của ngôn ngữ khác. Từ thuần Việt trong tiếng Việt hoặc từ thuần Hán trong tiếng Hán đều thuộc loại chữ cơ bản. 

Những từ ngữ có được sau khi tiếp xúc với một nền văn hóa khác thì thuộc loại “chữ văn hóa”, thường là những chữ có tính chất trừu tượng, khái niệm thuộc lĩnh vực văn hóa, ví dụ: đông, tây, đạo, lý. Chữ văn hóa thường xuất hiện sau chữ cơ bản hàng nghìn năm, vì thế nó không có liên quan đến nguồn gốc ngôn ngữ. Khi xác định nguồn gốc ngôn ngữ, nhất thiết phải dựa vào những chữ cơ bản mà không dựa vào những chữ văn hóa.

Cửu chương lập thành Toán pháp (九章立成算法) do Thập Lý hầu Ngô Sĩ cho in lần đầu vào đời Lê Dụ Tông, năm Vĩnh Thịnh Quí Tị (1713). Ảnh: Wikimedia

Sau khi phân loại ngữ vựng, Haudricourt nhận thấy số lượng chữ thuần Việt tương ứng với chữ trong ngôn ngữ Môn-Khmer thì nhiều hơn số  chữ thuần Việt tương ứng với chữ trong tiếng Thái, từ đó ông kết luận tiếng Việt có nguồn gốc Môn-Khmer chứ không phải có nguồn gốc Thái. Khi nghiên cứu vấn đề thanh điệu của tiếng Việt, ông cũng đi tới kết luận như vậy. 

Ngữ vựng tiếng Việt hiện đại gồm chữ thuần Việt, chữ Việt gốc Hán (tức chữ Hán-Việt), và chữ ngoại lai. Chữ thuần Việt ra đời cùng với tiếng Việt, có con số lớn và vững chắc gắn chặt với nguồn gốc dân tộc, thể hiện tính cội nguồn của ngôn ngữ, thuộc vào lớp chữ cơ bản. Chữ Việt gốc Hán ra đời sau khi nước ta tiếp xúc văn hóa Trung Hoa, cho nên thuộc lớp chữ văn hóa. Chữ lai ra đời sau khi Việt Nam tiếp xúc văn hóa Âu Mỹ, ví dụ các từ pho mát, ô tô, ga.

Chữ Hán-Việt là loại ngữ vựng do tổ tiên ta sáng tạo ra trong quá trình tiếp nhận chữ Hán. Thông thường người học chữ Hán đều phải đọc chữ theo âm tiếng Hán. Nhưng chữ Hán lại không có phát âm thống nhất trong toàn Trung Hoa, mà mỗi vùng phát âm theo cách riêng gọi là phương ngữ (tiếng địa phương). Người Trung Hoa sang ta nói nhiều phương ngữ khác nhau, người Việt không biết nên đọc chữ Hán theo cách phát âm nào, đây là khó khăn lớn nhất khi họ học chữ Hán.

Để vượt qua khó khăn trên, tổ tiên chúng ta đã sáng tạo ra cách đọc chữ Hán theo âm tiếng Việt mà không đọc theo âm Hán, tức cách phiên âm chữ Hán thành chữ Hán-Việt. Mỗi chữ Hán đơn âm được phiên âm thành một chữ Hán-Việt, chữ này có âm đọc thống nhất trong toàn dân Việt, gọi là âm Hán-Việt. Âm đọc ấy được chọn gần giống âm đọc chữ trong tiếng Hán, vì thế hầu hết chữ Hán-Việt đọc lên nghe gần giống từ tiếng Hán. Ví dụ chữ  文tiếng Hán đọc “uấn”, ta đọc tiếng Việt là “văn”. Qua đó đã thực hiện phiên âm toàn bộ chữ Hán sang tiếng Việt, mượn được toàn bộ kho chữ Hán về dùng, nhưng  chỉ mượn chữ mà không mượn tiếng Hán. Do tiếng Hán và tiếng Việt đều là ngôn ngữ đơn âm tiết (monosyllabic) nên việc phiên âm một đối một tương đối thuận tiện. chữ Hán-Việt là kết quả phiên âm chữ Hán, và chữ Hán trở thành ký tự ghi chữ Hán-Việt, nhưng không ghi được từ thuần Việt. Ví dụ chữ Hán 文化 ghi chữ Hán-Việt “văn hoá”. 

Việc tiếng Việt, tiếng Hán thuộc hai ngữ hệ khác nhau chứng tỏ ngôn ngữ Việt không cùng nguồn gốc với ngôn ngữ Hán. Như vậy thì cội nguồn văn hóa Việt Nam cũng không thể chung nguồn gốc với văn hóa Hán.

Chữ Hán-Việt là chữ vay mượn của chữ Hán. Nhờ mượn thêm chữ nước ngoài nên kho ngữ vựng tiếng Việt tăng lên nhiều và ngày càng tăng. Năm 1912 Maspéro nói chữ Hán-Việt chiếm 60% tổng số chữ tiếng Việt. Năm 2001 Cao Xuân Hạo nói tỷ lệ này là 70%. Nghĩa là chữ Hán vào Việt Nam đã làm số chữ tiếng Việt tăng 2,5-3 lần. Trong thực tế, người Việt dùng chữ rất linh hoạt, như ghép với từ thuần Việt (tái đàn, cận nghèo) hoặc ghép chữ Hán-Việt với nhau không theo quy tắc giữ gốc Hán (bán dẫn, giải ngân), cho nên kho ngữ vựng tiếng Việt có thể tăng vô hạn. 

Chữ Hán-Việt còn giúp người Việt thuận lợi chuyển ngữ các ngữ vựng ngoại văn: khi ấy chỉ cần đọc âm Hán-Việt của chữ Hán hoặc từ Kanji mà người Trung Hoa hoặc người Nhật chuyển ngữ từ ngoại văn đó, là được kết quả. Ví dụ từ tiếng Anh “pragmatism”, người Nhật chuyển sang chữ Kanji là 實用主義, chúng ta đọc Hán-Việt là “thực dụng chủ nghĩa”, được ngay kết quả cần tìm. 

Tóm lại sáng kiến phiên âm chữ Hán thành chữ Hán-Việt đã giúp người Việt thuận lợi tiếp nhận chữ Hán mà hoàn toàn không nói tiếng Hán, đồng thời làm cho kho ngữ vựng tiếng Việt có thể phát triển hầu như vô hạn. Đây là một thành tựu kiệt xuất về ngôn ngữ học của tổ tiên chúng ta. 

Cuốn sách “Lịch sử ngôn ngữ người Việt – Góp phần tìm hiểu văn hóa Việt Nam” của tác giả Trần Trí Dõi.

Thế nhưng không thể vì tiếng Việt có nhiều chữ gốc Hán mà cho rằng tiếng Việt có nguồn gốc ở tiếng Hán, vì chữ Hán-Việt không phải là chữ cơ bản, mà thuộc lớp chữ văn hóa, chỉ xuất hiện sau khi người Việt tiếp xúc văn hóa Trung Hoa, tức khi nước ta bị Triệu Đà thôn tính và người Việt bắt đầu học Hán ngữ, nghĩa là sau chữ thuần Việt nhiều nghìn năm, do đó chữ Hán-Việt dù nhiều đến đâu cũng không ảnh hưởng gì đến nguồn gốc tiếng Việt. 

Khi so sánh những chữ thuần Việt với những chữ thuần Hán, cũng không thấy chữ thuần Việt nào có âm đọc giống với chữ thuần Hán tương ứng. Sự khác nhau về từ cơ bản chứng tỏ tiếng Việt không cùng nguồn gốc với tiếng Hán. Điều đó còn được chứng tỏ ở chỗ tiếng Việt có ngữ âm phong phú (gấp 14 lần tiếng Hán) và ngữ pháp khác tiếng Hán. Chữ Hán-Việt được dùng theo ngữ pháp tiếng Việt, do đó người Trung Hoa không thể nghe hiểu câu tiếng Việt có nhiều chữ Hán-Việt, tuy rằng nhìn chữ thì hiểu. Nói cách khác, tiếng Việt tuyệt đối không phải là một phương ngữ của tiếng Hán.   

Chữ Hán – Việt chỉ là chữ vay mượn (loan words) Hán ngữ. Những ngôn ngữ trên thế giới thường vay mượn ngữ vựng của ngôn ngữ khác. Ví dụ Hán ngữ hiện đại có khoảng 70% chữ thuộc lĩnh vực khoa học xã hội – nhân văn là chữ vay mượn tiếng Nhật. Đó là những ngữ vựng người Nhật chuyển ngữ từ tiếng Anh, Pháp, Hoà Lan… sang chữ Kanji (chữ Hán-Nhật), ví dụ những chữ government, people, economy chuyển ngữ thành chính phủ, nhân dân, kinh tế. Ngôn ngữ học cho biết: chữ văn hóa thường dễ vay mượn, còn chữ cơ bản thì không có vay mượn. Ví dụ tên tiếng Việt gọi các bộ phận cơ thể con người khác xa tên gọi tương ứng trong những thứ tiếng khác. Thiển nghĩ có thể suy ra ban đầu dân ta chỉ nói những chữ thuần Việt, sau khi tiếp nhận chữ Hán thì bắt đầu nói những chữ Hán-Việt, và ngày càng nói nhiều, nhất là khi nói đề tài xã hội, thời sự, nghị luận, đặc biệt trong văn bản, sách báo. Như trong Hiến pháp Việt Nam, tỷ lệ chữ Hán-Việt lên tới 90%.

Hiện nay giới ngôn ngữ học chính thống Việt Nam và thế giới xếp tiếng Việt thuộc ngữ hệ Nam Á, nhánh Môn-Khmer, nhóm tiếng Việt (Vietic, Việt-Mường); Hán ngữ thuộc ngữ hệ Hán-Tạng. Việc tiếng Việt, tiếng Hán thuộc hai ngữ hệ khác nhau chứng tỏ ngôn ngữ Việt không cùng nguồn gốc với ngôn ngữ Hán. Đây là một kết luận quan trọng thu được sau 150 năm nghiên cứu vấn đề nguồn gốc tiếng Việt. Trên cơ sở ấy tác giả Trần Trí Dõi nhận định: Như vậy thì cội nguồn văn hóa Việt Nam cũng không thể chung nguồn gốc với văn hóa Hán.

Thiển nghĩ vì tiếng Việt khác ngữ hệ với các ngôn ngữ Bách Việt, suy ra tiếng Việt cũng không cùng nguồn gốc với các ngôn ngữ Bách Việt, ví dụ Tráng ngữ là hậu duệ của ngôn ngữ Lạc Việt(3) thuộc ngữ hệ Tai-Kadai, các ngôn ngữ khác của Bách Việt đều thuộc ngữ hệ Hán-Tạng.

So với Hán ngữ, tiếng Việt có số âm tiết cơ bản nhiều gấp 10 lần, số âm tiết chi tiết gấp 14 lần. Ưu thế đó làm cho tiếng Việt trở nên vững bền không dễ bị đồng hóa bởi những ngôn ngữ nghèo ngữ âm như Hán ngữ.

Tác giả sách Lịch sử ngôn ngữ người Việt còn đưa ra một nhận định quan trọng: Về mặt ngôn ngữ, đã có đủ cơ sở để cho rằng cộng đồng người nói tiếng Việt thực sự là một trong những cộng đồng cư dân bản địa chính từ thời tiền sử của vùng Đông Nam Á văn hóa, chứ hoàn toàn không phải là những cư dân di cư từ phương Bắc tới. Đây là một quan điểm đúng đắn về lịch sử dân tộc Việt, là kết quả nghiên cứu dựa trên sự tìm hiểu nguồn gốc ngôn ngữ của người Việt trong sự so sánh với ngôn ngữ các dân tộc ở gần, tức dựa trên các nguyên tắc có căn cứ khoa học tin cậy của ngôn ngữ học lịch sử và so sánh (Historical-Comparative Linguistics). 

Kết luận trên cho thấy dân tộc Việt được hình thành trên mảnh đất này từ khoảng hơn 20 nghìn năm trước. Có thể là, theo thuyết “Đi khỏi châu Phi” (Out of Africa), trước đó tổ tiên chúng ta từ châu Phi di cư tới đây. Năm 1923, nhà khảo cổ Madeleine Coloni tìm thấy di cốt người Việt cùng nền văn hóa của họ trong hang đá ở tỉnh Hòa Bình, các di vật này có niên đại 18.000 năm trước CN. Hiện nay Trung tâm Nghiên cứu Tiền sử Đông Nam Á của tiến sĩ Nguyễn Việt vẫn tiếp tục khai quật các di vật nền Văn hóa Hòa Bình lưu lại.(4) 

Lịch sử lâu đời giúp cho người Việt có đủ thời gian tạo được một ngôn ngữ chín muồi, thật giầu âm tiết (syllable). So với Hán ngữ, tiếng Việt có số âm tiết cơ bản nhiều gấp 10 lần, số âm tiết chi tiết gấp 14 lần.(5, 6, 7) Ưu thế đó làm cho tiếng Việt trở nên vững bền không dễ bị những ngôn ngữ nghèo ngữ âm như Hán ngữ đồng hóa. 

Thiển nghĩ, kết luận người Việt “hoàn toàn không phải là cư dân di cư từ phương Bắc tới” cho thấy dân tộc ta thời cổ không có quan hệ gần gũi với các dân tộc ở phía Bắc biên giới Trung-Việt, với nhóm bộ tộc gọi là “Bách Việt”, chẳng những về địa lý ở xa cách họ mà về ngôn ngữ hoàn toàn không chung nguồn gốc: ngôn ngữ những tộc đó đều thuộc ngữ hệ khác ngữ hệ của tiếng Việt. Có thể suy ra người Việt nguyên thủy sống ở vùng núi Sơn La-Hòa Bình-Thanh Hóa, về sau các bộ tộc người Kinh di chuyển dần xuống vùng trung du Yên Bái, Phú Thọ, trong khoảng 2.000 năm gần đây di chuyển xuống vùng châu thổ sông Hồng – vùng đất hình thành bởi sự bồi đắp của con sông này, như quan điểm của các nhà khoa học Lê Bá Thảo, Trần Trí Dõi…(8). Riêng các bộ tộc người Mường anh em gần nhất của người Kinh thì vẫn ở lại vùng núi.

Cần nhấn mạnh, việc người Việt dùng chữ Hán nhưng không nói tiếng Hán đã mang lại kết quả tất nhiên là tuy văn hóa Việt trong hơn 1000 năm Bắc thuộc từng bị Hán hóa dai dẳng, nhưng tiếng Hán vẫn không thể đồng hóa được ngôn ngữ của người Việt. Nhờ giữ được nguyên vẹn tiếng mẹ đẻ mà dân tộc cùng quốc gia này tồn tại đến ngày nay – đây là thắng lợi vĩ đại nhất trong lịch sử dân tộc Việt Nam. Ai cũng biết văn hóa Hán có sức đồng hóa rất mạnh. Ví dụ dân tộc Mãn từng chiếm đóng cai trị Trung Hoa 276 năm, mới đầu họ ra sức Mãn hóa ngôn ngữ và văn hóa của người Hán, nhưng chỉ sau một thế kỷ, chính họ lại bị Hán hóa, toàn bộ dân tộc Mãn chỉ nói tiếng Hán, dùng chữ Hán. 

Thời Bắc thuộc có nhiều người Bách Việt (phần lớn là binh lính) sang Việt Nam định cư, ngôn ngữ của họ có ảnh hưởng đến kết quả phiên âm chữ Hán, tức chữ Hán-Việt. Ví dụ chữ Hán  学习 tiếng Quảng Đông đọc “hoọc chập”, chữ Hán-Việt là “học tập”, tuy rằng tiếng Bắc Kinh đọc “xuế xí”. Nhưng vì họ nhanh chóng bị Việt Nam hóa (lấy vợ Việt, con cháu nói tiếng Việt) cho nên ảnh hưởng của ngôn ngữ Bách Việt đối với tiếng Việt hầu như không có gì đáng kể.

Tóm lại, tiếng Việt là ngôn ngữ gần gũi nhất với Hán ngữ và chịu ảnh hưởng lớn của Hán ngữ nhưng lại không cùng nguồn gốc với Hán ngữ và không bị Hán hóa cho dù Việt Nam từng là quận huyện của Trung Hoa trong hơn 1000 năm. Chẳng rõ còn có dân tộc nào khác từng làm được điều kỳ diệu tương tự? □

Nếu đăng lại, xin ghi nguồn và đọc “Thể lệ trích đăng lại bài từ DCVOnline.net


Nguồn: Nguyễn Hải Hoành,  “Vì sao tiếng Việt không cùng nguồn gốc với tiếng Hán?”  | Tia Sáng | 28

10, 2023

Ghi chú:

(1) Trần Trí Dõi: “Lịch sử ngôn ngữ người Việt – Góp phần tìm hiểu văn hóa Việt Nam”, Nxb ĐHQGHN, 2022.

(2) Joseph Simon Theurel, 1829-1868, người Pháp, Giám mục Giáo phận Hà Nội 1859-1868. Nhà thờ Kẻ Sở ở thị trấn Kiện Khê, Hà Nam thuộc Giáo phận Hà Nội là một trong bốn nhà thờ được gọi là Vương cung Thánh đường.

(3) 梁庭望: 骆越方国研究》民族出版社, 2017年.. Đây là quan điểm riêng của nhóm Lương Đình Vọng.

(4) “Văn hóa Hòa Bình: Nền văn hóa tiền sử độc đáo”. Báo Điện tử Chính phủ, 30/8/2023.

(5) Nguyễn Quang Hồng: “Âm tiết và loại hình ngôn ngữ”, Nxb ĐHQG Hà Nội, 1995.
(6) 苏培成: “二十世纪的现代汉字研究”, 书海出版社, 2001年.

(7) Nguyễn Hải Hoành: “Một vài tìm tòi về ngôn ngữ”, tạp chí Tia Sáng số 11/2020.

(8) Li Tana: “A Historical Sketch of the Landscape of the Red River Delta” Cambridge University Press, 2016