Mối đe dọa là sự trôi dạt thoải mái đối với việc không hiểu những gì bạn đang làm
The threat is comfortable drift toward not understanding what you're doing
Bài viết cảnh báo một rủi ro "bẫy thoải mái" (comfortable drift) khi các developer quá dựa vào AI hỗ trợ. AI có thể cho ra kết quả trông có vẻ đúng đắn, nhưng thực chất người dùng lại thiếu đi sự hiểu biết sâu sắc về vấn đề gốc rễ. Một ví dụ điển hình là trường hợp của Bob, một nghiên cứu sinh PhD, đã dùng AI để hoàn thành nghiên cứu và bài báo của mình. Ngược lại, Alice, một nghiên cứu sinh khác, lại đạt được sự hiểu biết vững vàng nhờ các phương pháp truyền thống. Nguy hiểm nằm ở chỗ các hệ thống đánh giá hiện tại thường ưu tiên kết quả đo lường được (như bài báo) hơn là quá trình học hỏi quan trọng nhưng khó định lượng. Đối với các developer, việc chỉ dựa vào AI cho việc code, debug hay giải thích có thể dẫn đến việc nắm bắt công việc một cách hời hợt, cản trở khả năng giải quyết vấn đề thực sự và sự phát triển lâu dài trong sự nghiệp.
Hãy tưởng tượng bạn là một trợ lý giáo sư mới tại một trường đại học nghiên cứu. Bạn vừa nhận được công việc, bạn vừa nhận được một khoản tài trợ khởi nghiệp nhỏ và bạn vừa thuê...
Tháng 3, 2026
Hãy tưởng tượng bạn là một trợ lý giáo sư mới tại một trường đại học nghiên cứu. Bạn vừa nhận được công việc, vừa có một khoản kinh phí khởi nghiệp nhỏ, và bạn vừa thuê hai nghiên cứu sinh tiến sĩ đầu tiên của mình: Alice và Bob. Bạn đang làm trong lĩnh vực vật lý thiên văn. Đây là khởi đầu của mọi thứ.
Bạn làm những gì mà người hướng dẫn của bạn đã làm cho bạn, nhiều năm trước: bạn giao cho mỗi người một dự án được xác định rõ ràng. Một cái gì đó bạn biết là có thể giải quyết được, bởi vì những người khác đã giải quyết các phiên bản liền kề của nó. Một cái gì đó mà cá nhân bạn sẽ mất khoảng một đến hai tháng để hoàn thành. Bạn mong đợi mỗi sinh viên sẽ mất khoảng một năm, bởi vì họ chưa biết mình đang làm gì, và đó là vấn đề. Dự án không phải là sản phẩm bàn giao. Dự án là phương tiện. Sản phẩm bàn giao là nhà khoa học xuất hiện ở cuối.
Dự án của Alice là xây dựng một quy trình phân tích để đo lường một chữ ký thống kê cụ thể trong dữ liệu phân cụm thiên hà. Dự án của Bob cũng tương tự về phạm vi và độ khó, một tín hiệu khác, một tập dữ liệu khác, cùng một cung đường học tập cơ bản. Bạn gửi cho mỗi người một vài bài báo để đọc, chỉ cho họ một số dữ liệu có sẵn công khai, và yêu cầu họ bắt đầu bằng cách tái tạo lại một kết quả đã biết. Sau đó bạn chờ đợi.
Năm học diễn ra theo cách mà các năm học thường diễn ra. Bạn có các cuộc họp hàng tuần với mỗi sinh viên. Alice bị mắc kẹt với hệ tọa độ. Bob không thể làm cho hàm hợp lý của mình hội tụ. Alice viết một script vẽ biểu đồ cho ra kết quả vô nghĩa. Bob đọc sai quy ước dấu trong một bài báo quan trọng và dành hai tuần để truy tìm lỗi gấp đôi. Bạn đưa ra phản hồi tương tự cho cả hai: đọc lại bài báo, kiểm tra đơn vị của bạn, thử in kết quả trung gian, suy nghĩ xem kết quả nên như thế nào trước khi xem kết quả mà mã của bạn đưa ra. Những điều bình thường. Những điều bạn nói năm mươi lần một năm và không bao giờ nhớ đã nói.
Đến mùa hè, cả hai sinh viên đều đã hoàn thành. Cả hai bài báo đều chắc chắn. Không đột phá, không thay đổi được lĩnh vực, nhưng chính xác, hữu ích và có thể xuất bản. Cả hai đều trải qua một vòng sửa đổi nhỏ tại một tạp chí uy tín và cuối cùng cũng được chấp nhận. Một kết quả hoàn toàn bình thường. Loại kết quả mà toàn bộ bộ máy đào tạo học thuật được thiết kế để tạo ra.
Nhưng Bob có một bí mật.
Không giống như Alice, người đã dành cả năm để đọc các bài báo với bút chì trong tay, ghi chú vào lề, bối rối, đọc lại, tra cứu và dần dần xây dựng một sự hiểu biết làm việc về lĩnh vực của mình, Bob đã sử dụng một tác nhân AI. Khi người hướng dẫn của anh ấy gửi cho anh ấy một bài báo để đọc, Bob yêu cầu tác nhân tóm tắt nó. Khi anh ấy cần hiểu một phương pháp thống kê mới, anh ấy yêu cầu tác nhân giải thích nó. Khi mã Python của anh ấy bị lỗi, tác nhân đã sửa nó. Khi lỗi sửa của tác nhân lại gây ra một lỗi mới, nó cũng sửa luôn lỗi đó. Khi đến lúc viết bài báo, tác nhân đã viết nó. Các bản cập nhật hàng tuần của Bob cho người hướng dẫn không khác gì Alice. Các câu hỏi tương tự. Tiến độ tương tự. Quỹ đạo, nhìn từ bên ngoài, là giống hệt nhau.
Đây là lúc mọi thứ trở nên thú vị. Nếu bạn là một quản trị viên, một cơ quan tài trợ, một ủy ban tuyển dụng, hoặc một trưởng khoa ám ảnh về số liệu, Alice và Bob đã có một năm giống nhau. Mỗi người một bài báo. Mỗi người một bộ sửa đổi nhỏ. Mỗi người một đóng góp chắc chắn cho tài liệu. Theo mọi thước đo định lượng mà học viện hiện đại sử dụng để đánh giá giá trị của một nhà khoa học, họ có thể thay thế cho nhau. Chúng ta đã xây dựng toàn bộ hệ thống đánh giá dựa trên việc đếm những gì có thể đếm được, và hóa ra điều thực sự quan trọng lại là thứ duy nhất không thể đếm được.
Tình hình còn tệ hơn. Phần lớn các nghiên cứu sinh sẽ rời bỏ học viện trong vòng vài năm sau khi hoàn thành. Mọi người đều biết điều này. Khoa biết, cơ quan tài trợ biết, người hướng dẫn có lẽ cũng biết ngay cả khi không ai nói ra thành lời. Điều đó có nghĩa là, từ góc độ của tổ chức, câu hỏi liệu Alice hay Bob trở thành một *nhà khoa học* giỏi hơn hay không về cơ bản là vấn đề của người khác. Khoa cần bài báo, vì bài báo biện minh cho nguồn tài trợ, và nguồn tài trợ biện minh cho khoa. Sinh viên là phương tiện sản xuất. Cho dù sinh viên đó bước ra ngoài cửa năm năm sau với tư cách là một người tư duy độc lập hay một kỹ sư gợi ý (prompt engineer) có năng lực thì, về mặt tổ chức, là không liên quan. Cấu trúc khuyến khích không chỉ thất bại trong việc phân biệt giữa Alice và Bob. Nó không có lý do gì để cố gắng.
Đây là phần mà tôi muốn nói với bạn rằng hệ thống bị lỗi. Nó không bị lỗi. Nó đang hoạt động đúng như thiết kế.
David Hogg, trong bài viết trắng của mình, đã nói một điều đi ngược lại logic của tổ chức này một cách sắc bén đến mức tôi ngạc nhiên là không có nhiều người nói về nó. Ông ấy lập luận rằng trong vật lý thiên văn, con người luôn là mục đích, không bao giờ là phương tiện. Khi chúng ta thuê một nghiên cứu sinh để làm việc trong một dự án, không phải vì chúng ta cần kết quả cụ thể đó. Đó là vì sinh viên sẽ được hưởng lợi từ việc thực hiện công việc đó. Điều này nghe có vẻ lý tưởng cho đến khi bạn nghĩ về vật lý thiên văn thực sự là gì. Cuộc sống của không ai phụ thuộc vào giá trị chính xác của hằng số Hubble. Không có chính sách nào thay đổi nếu tuổi của Vũ trụ là 13,77 tỷ năm thay vì 13,79 tỷ năm. Không giống như y học, nơi một phương pháp chữa bệnh Alzheimer sẽ vô giá bất kể là con người hay AI phát hiện ra nó, vật lý thiên văn không có đầu ra lâm sàng. Kết quả, theo nghĩa thực tế nghiêm ngặt, không quan trọng. Điều quan trọng là quá trình đạt được chúng: sự phát triển và ứng dụng các phương pháp, đào tạo tâm trí, tạo ra những người biết cách suy nghĩ về các vấn đề khó khăn. Nếu bạn giao quá trình đó cho máy móc, bạn không tăng tốc khoa học. Bạn đã loại bỏ phần duy nhất của nó mà bất kỳ ai thực sự cần.
Thừa nhận là điều đó khó thuyết phục một cơ quan tài trợ.
Điều này đưa chúng ta trở lại Alice và Bob, và những gì thực sự xảy ra với mỗi người trong năm đó. Alice bây giờ có thể làm mọi thứ. Cô ấy có thể mở một bài báo mà cô ấy chưa từng thấy trước đây và, với nỗ lực, làm theo lập luận. Cô ấy có thể viết một hàm hợp lý từ đầu. Cô ấy có thể nhìn vào một biểu đồ và biết, trước khi kiểm tra, rằng có điều gì đó không ổn với việc chuẩn hóa. Cô ấy đã dành một năm để xây dựng một cấu trúc bên trong đầu mình, và cấu trúc đó giờ là của cô ấy, vĩnh viễn, có thể di chuyển, độc lập với bất kỳ công cụ hoặc đăng ký nào. Bob không có bất kỳ điều nào trong số này. Hãy lấy đi tác nhân, và Bob vẫn là một sinh viên năm nhất chưa bắt đầu. Năm đã xảy ra xung quanh anh ấy nhưng không phải bên trong anh ấy. Anh ấy đã bàn giao một sản phẩm, nhưng anh ấy đã không học được một nghề.
Tôi đã suy nghĩ rất nhiều về Alice và Bob gần đây, vì câu hỏi các tác nhân AI đang làm gì với nghiên cứu học thuật là một trong những điều mà lĩnh vực của tôi, vật lý thiên văn, đang gặp khó khăn. Một số người mà tôi kính trọng đã viết những bài viết sâu sắc về vấn đề này. Bài báo trắng của David Hogg, mà tôi đã đề cập ở trên, cũng lập luận chống lại cả việc áp dụng hoàn toàn LLM và cấm hoàn toàn, đó là loại ngồi chừng nguyên tắc chỉ hiệu quả khi hàng rào được xây dựng tốt, và hàng rào của ông ấy là như vậy. Natalie Hogg đã viết một bài tiểu luận thẳng thắn một cách đáng ngạc nhiên về sự chuyển đổi của chính cô ấy từ một người hoài nghi LLM mạnh mẽ thành người dùng hàng ngày, lần theo dấu vết cách những nguyên tắc vững chắc của cô ấy hóa ra lại phụ thuộc vào ngữ cảnh hơn cô ấy mong đợi một khi cô ấy thấy mình ở trong một môi trường mà các công cụ có ở khắp mọi nơi. Matthew Schwartz đã viết về thử nghiệm của mình khi giám sát Claude thông qua một phép tính vật lý lý thuyết thực tế, sản xuất một bài báo có thể xuất bản trong hai tuần thay vì một năm, và kết luận rằng LLM hiện tại hoạt động ở cấp độ của sinh viên tốt nghiệp năm thứ hai. Mỗi bài viết này đều thú vị. Mỗi bài đều nắm bắt một khía cạnh thực sự của vấn đề. Không bài nào trong số đó thực sự giải quyết được điều khiến tôi trằn trọc.
Thử nghiệm của Schwartz là tiết lộ nhất, và không phải vì lý do ông ấy nghĩ. Điều ông ấy chứng minh là Claude có thể, với sự giám sát chi tiết, tạo ra một bài báo vật lý nghiêm ngặt về mặt kỹ thuật. Điều ông ấy thực sự chứng minh, nếu bạn đọc kỹ, là sự giám sát *là* vật lý. Claude đã tạo ra bản nháp đầu tiên hoàn chỉnh trong ba ngày. Nó trông chuyên nghiệp. Các phương trình có vẻ đúng. Các biểu đồ khớp với mong đợi. Sau đó, Schwartz đọc nó, và nó sai. Claude đã điều chỉnh các tham số để làm cho các biểu đồ khớp thay vì tìm ra lỗi thực tế. Nó đã bịa đặt kết quả. Nó đã bịa đặt các hệ số. Nó đã tạo ra các tài liệu xác minh không xác minh bất cứ điều gì. Nó khẳng định kết quả mà không có suy luận. Nó đơn giản hóa các công thức dựa trên các mẫu từ các vấn đề khác thay vì làm việc thông qua các chi tiết cụ thể của vấn đề hiện tại. Schwartz đã phát hiện ra tất cả điều này bởi vì ông ấy đã làm vật lý lý thuyết trong nhiều thập kỷ. Ông ấy biết câu trả lời nên trông như thế nào. Ông ấy biết cần yêu cầu những kiểm tra chéo nào. Ông ấy biết rằng một thuật ngữ logarit cụ thể là đáng ngờ vì ông ấy đã tính toán các thuật ngữ tương tự bằng tay, nhiều lần, trong nhiều năm, theo cách khó khăn. Thử nghiệm đã thành công bởi vì người giám sát con người đã làm công việc nặng nhọc, nhiều năm trước, mà máy móc hiện đang giải phóng chúng ta khỏi đó. Nếu Schwartz là Bob thay vì Schwartz, bài báo sẽ sai, và cả hai sẽ không biết.
Có một phản bác phổ biến cho điều này, và tôi nghe nó liên tục. "Cứ chờ đi," mọi người nói. "Trong vài tháng, trong một năm, các mô hình sẽ tốt hơn. Chúng sẽ không bị ảo giác. Chúng sẽ không bịa đặt biểu đồ. Những vấn đề bạn đang mô tả là tạm thời." Tôi đã nghe "cứ chờ đi" kể từ năm 2023. Các cột mốc di chuyển với tốc độ gần như giống với tốc độ cải thiện của các mô hình, đó là sự trùng hợp ngẫu nhiên hay là một dấu hiệu. Nhưng hãy gác điều đó sang một bên. Nhưng sự phản đối này hiểu lầm những gì thử nghiệm của Schwartz thực sự cho thấy. Các mô hình đã đủ mạnh để tạo ra kết quả có thể xuất bản dưới sự giám sát có năng lực. Đó không phải là nút thắt cổ chai. Nút thắt cổ chai là sự giám sát. Các mô hình mạnh hơn sẽ không loại bỏ nhu cầu về một con người hiểu vật lý; chúng sẽ chỉ mở rộng phạm vi các vấn đề mà một tác nhân được giám sát có thể giải quyết. Người giám sát vẫn cần biết câu trả lời nên trông như thế nào, vẫn cần biết cần yêu cầu những kiểm tra nào, vẫn cần có trực giác rằng có điều gì đó không ổn trước khi họ có thể diễn đạt lý do tại sao. Trực giác đó không đến từ một đăng ký. Nó đến từ nhiều năm thất bại trong chính loại công việc mà mọi người gọi là công việc nặng nhọc. Làm cho các mô hình thông minh hơn không giải quyết được vấn đề. Nó làm cho vấn đề khó nhìn thấy hơn.
Tôi muốn kể cho bạn nghe về một cuộc trò chuyện tôi đã có vài năm trước, khi các chatbot LLM mới bắt đầu xuất hiện trong quy trình làm việc học thuật. Tôi đã ở một hội nghị ở Đức và cuối cùng đã nói chuyện với một đồng nghiệp, người mà theo bất kỳ tiêu chuẩn nào, đều rất thành công. Các khoản tài trợ lớn. Các bài báo có ảnh hưởng. Loại CV khiến ủy ban tuyển dụng gật đầu tán thành. Chúng tôi đã thảo luận về LLM, và tôi đang đưa ra một điểm mà tôi nghĩ là hợp lý về dân chủ hóa: rằng các công cụ này có thể san bằng sân chơi cho những người nói tiếng Anh không phải bản xứ, những người luôn gặp bất lợi khi viết đề tài và bài báo bằng một ngôn ngữ mà họ học khi trưởng thành. Đồng nghiệp của tôi trở nên kích động rõ rệt. Ông ấy không quan tâm đến góc độ dân chủ hóa. Ông ấy không quan tâm đến chi phí môi trường. Ông ấy, khi loại bỏ các khuôn khổ trí tuệ, đã sợ hãi. Cuối cùng, sau khi bị thúc ép, ông ấy đã diễn đạt điều này: nếu bất kỳ ai cũng có thể viết bài báo, đề xuất và mã trôi chảy như ông ấy, thì những người như ông ấy sẽ mất lợi thế cạnh tranh. Mối quan tâm không phải là về khoa học. Mối quan tâm là về địa vị. Cụ thể là của ông ấy.
Tôi đã mất liên lạc với đồng nghiệp này một thời gian. Gần đây tôi đã để ý hồ sơ GitHub của anh ấy. Bây giờ anh ấy không chỉ sử dụng các tác nhân AI cho nghiên cứu của mình mà còn nhiệt tình ủng hộ chúng. Không cần phải tự viết mã trong hai tuần khi một tác nhân có thể làm điều đó trong hai giờ, anh ấy nói. Tôi không nghĩ anh ấy sai về hiệu quả. Tôi nghĩ đáng chú ý là người từng bị đe dọa nhất bởi các công cụ này khi chúng có thể làm cho mọi người bình đẳng, giờ lại là người nhiệt tình nhất với chúng khi chúng có thể thúc đẩy anh ấy. Thật kỳ lạ khi mọi thứ lại diễn ra như vậy.
Tuy nhiên, cụm từ anh ấy sử dụng ngày hôm đó ở Đức đã đọng lại trong tôi. Anh ấy nói rằng "LLM sẽ lấy đi những gì tuyệt vời về khoa học." Lúc đó, tôi nghĩ anh ấy chỉ nói về lợi thế cạnh tranh của riêng mình, sự trôi chảy của anh ấy với tư cách là người nói tiếng Anh bản xứ, khả năng viết nhanh và xuất bản thường xuyên của anh ấy. Và đúng là vậy. Nhưng tôi đã nghĩ rằng chính cụm từ đó đã đúng hơn anh ấy biết, ngay cả khi lý do anh ấy nói ra nó phần lớn là vì lợi ích cá nhân. Điều tuyệt vời về khoa học *chính là* con người của nó. Quá trình chậm chạp, cứng đầu, đôi khi đau đớn mà một sinh viên bối rối trở thành một người tư duy độc lập. Nếu chúng ta sử dụng các công cụ này để bỏ qua quá trình đó để đổi lấy đầu ra nhanh hơn, chúng ta không chỉ có nguy cơ lấy đi những gì tuyệt vời về khoa học. Chúng ta lấy đi phần duy nhất của nó không thể thay thế ngay từ đầu.
Cuộc thảo luận xung quanh LLM trong khoa học có xu hướng tập trung vào hai thái cực mà David Hogg xác định rõ ràng: let-them-cook (hãy để họ nấu), trong đó chúng ta giao quyền kiểm soát cho máy móc và trở thành người quản lý kết quả đầu ra của chúng, và ban-and-punish (cấm và trừng phạt), trong đó chúng ta giả vờ là năm 2019 và truy tố bất kỳ ai bị bắt quả tang nhắc lệnh. Cả hai đều tồi tệ. Let-them-cook dẫn đến, trong vòng vài năm, cái chết của ngành vật lý thiên văn của con người: máy móc có thể tạo ra các bài báo với tốc độ gấp khoảng một trăm nghìn lần so với một nhóm con người, và dòng chảy kết quả sẽ nhấn chìm tài liệu theo cách mà nó về cơ bản không thể sử dụng được bởi những người mà nó phục vụ. Ban-and-punish vi phạm quyền tự do học thuật, không thể thực thi được, và yêu cầu các nhà khoa học mới vào nghề cạnh tranh với một tay bị trói sau lưng trong khi các giáo sư có thâm niên âm thầm sử dụng Claude trong văn phòng tại nhà của họ. Không chính sách nào là nghiêm túc. Cả hai đều chủ yếu là sự phóng chiếu.
Nhưng mối đe dọa thực sự không phải là một trong hai điều đó. Nó âm thầm hơn, nhàm chán hơn, và do đó nguy hiểm hơn. Mối đe dọa thực sự là sự trôi dạt chậm rãi, thoải mái dẫn đến việc không hiểu những gì bạn đang làm. Không phải sự sụp đổ kịch tính. Không phải Skynet. Chỉ là một thế hệ các nhà nghiên cứu có thể đưa ra kết quả nhưng không thể đưa ra sự thấu hiểu. Người biết nút nào cần bấm nhưng không biết tại sao những nút đó tồn tại. Người có thể đưa một bài báo qua quá trình phản biện đồng nghiệp nhưng không thể ngồi trong phòng với đồng nghiệp và giải thích, từ gốc rễ, tại sao số hạng thứ ba trong khai triển của họ lại có dấu như vậy.
Frank Herbert (vâng, tôi biết tôi là người mê khoa học viễn tưởng), trong God Emperor of Dune, có một nhân vật nhận xét: "Những cỗ máy như vậy thực sự làm gì? Chúng làm tăng số lượng những điều chúng ta có thể làm mà không cần suy nghĩ. Những điều chúng ta làm mà không cần suy nghĩ; đó là mối nguy hiểm thực sự." Herbert đang viết khoa học viễn tưởng. Tôi đang viết về văn phòng của mình. Khoảng cách giữa hai điều đó đã trở nên nhỏ đến mức khó chịu.
Tôi nên thẳng thắn về bối cảnh tôi đang viết, bởi vì bài luận này sẽ trở nên khó chịu nếu đến từ ai đó chưa bao giờ động chạm đến LLM. Tôi sử dụng các tác nhân AI thường xuyên, và hầu hết mọi người trong nhóm nghiên cứu của tôi cũng vậy. Các đồng nghiệp tôi làm việc cùng tạo ra kết quả vững chắc với các công cụ này. Nhưng khi bạn nhìn vào cách họ sử dụng chúng, có một mô hình: họ biết mã nguồn nên làm gì trước khi yêu cầu tác nhân viết nó. Họ biết bài báo nên nói gì trước khi để nó giúp về cách diễn đạt. Họ có thể giải thích mọi hàm, mọi tham số, mọi lựa chọn mô hình, bởi vì họ đã xây dựng kiến thức đó qua nhiều năm làm mọi thứ theo cách chậm chạp. Nếu mọi công ty AI phá sản ngày mai, những người này sẽ chậm hơn. Họ sẽ không bị lạc lối. Họ đến với công cụ sau khi đã được đào tạo, không phải thay thế nó. Thứ tự đó quan trọng hơn bất cứ điều gì khác trong cuộc trò chuyện này.
Khi tôi thấy các nghiên cứu sinh tiến sĩ trẻ mới bước vào lĩnh vực này, tôi thấy một điều khác. Tôi thấy những sinh viên vươn tới tác nhân trước khi vươn tới sách giáo khoa. Những người yêu cầu Claude giải thích một bài báo thay vì đọc nó. Những người yêu cầu Claude triển khai một mô hình toán học trong Python thay vì tự mình thử, thất bại, nhìn chằm chằm vào thông báo lỗi, lại thất bại, và cuối cùng hiểu không chỉ mô hình mà còn cả hàng tá điều liên quan mà họ phải học để làm cho nó hoạt động. Những thất bại là chương trình giảng dạy. Các thông báo lỗi là giáo trình. Mỗi giờ bạn dành ra trong sự bối rối là một giờ bạn xây dựng cơ sở hạ tầng bên trong đầu mình, thứ cuối cùng sẽ cho phép bạn làm công việc sáng tạo. Không có con đường tắt nào qua quá trình đó mà không khiến bạn bị suy giảm ở phía bên kia.
Mọi người gọi sự cản trở này là "công việc vất vả". Schwartz sử dụng chính xác cụm từ đó, và ông ấy đúng khi nói rằng LLM có thể loại bỏ nó. Điều ông ấy không nói, bởi vì ông ấy đã có hàng thập kỷ trực giác khó khăn giành được và không còn cần công việc vất vả nữa, là đối với một người chưa có trực giác đó, công việc vất vả *chính là* công việc. Những phần nhàm chán và những phần quan trọng đan xen vào nhau theo cách mà bạn không thể tách rời trước. Bạn không biết buổi chiều gỡ lỗi nào đã dạy bạn điều gì đó cơ bản về dữ liệu của mình cho đến ba năm sau, khi bạn đang làm việc trên một vấn đề hoàn toàn khác và cái nhìn sâu sắc đó xuất hiện. Sự tình cờ không đến từ hiệu quả. Nó đến từ việc dành thời gian trong không gian mà vấn đề tồn tại, làm việc chăm chỉ, mắc sai lầm mà không ai yêu cầu bạn mắc và học những điều không ai giao cho bạn học.
Điều kỳ lạ là chúng ta đã biết điều này. Chúng ta luôn biết điều này. Mọi sách giáo khoa vật lý từng được viết đều đi kèm với các bài tập cuối mỗi chương, và mọi giáo sư vật lý từng đứng trước giảng đường đều nói điều tương tự: bạn không thể học vật lý bằng cách xem người khác làm. Bạn phải cầm bút lên. Bạn phải thử giải bài toán. Bạn phải làm sai, ngồi với sự sai lầm đó, và tìm ra lý do tại sao lập luận của bạn lại sai. Đọc sách giải và gật gù có vẻ giống như sự thấu hiểu. Đó không phải là sự thấu hiểu. Mọi sinh viên đã cố gắng vượt qua bài tập bằng cách đọc lời giải rồi trượt kỳ thi đều hiểu điều này bằng cả xương tủy. Chúng ta có hàng thế kỷ kiến thức sư phạm tích lũy nói với chúng ta rằng nỗ lực, bao gồm cả nỗ lực thất bại, là nơi sự học hỏi tồn tại. Vậy mà, bằng cách nào đó, khi nói đến các tác nhân AI, chúng ta đã cùng nhau quyết định rằng có lẽ lần này đã khác. Rằng có lẽ việc gật gù với kết quả của Claude là sự thay thế cho việc tự mình tính toán. Nó không phải. Chúng ta đã biết điều đó trước khi LLM tồn tại. Chúng ta dường như đã quên nó ngay khi chúng trở nên tiện lợi.
Hàng thế kỷ sư phạm, bị đánh bại bởi một cửa sổ trò chuyện.
Đây là sự khác biệt mà tôi nghĩ rằng cuộc tranh luận hiện tại đang bỏ lỡ. Sử dụng LLM như một bảng âm thanh: ổn. Sử dụng nó như một trình dịch cú pháp khi bạn biết mình muốn nói gì nhưng không nhớ chính xác từ khóa Matplotlib: ổn. Sử dụng nó để tra cứu quy ước định dạng BibTeX để bạn không phải mò mẫm qua Stack Overflow: ổn. Trong tất cả các trường hợp này, con người là kiến trúc sư. Máy móc nắm giữ từ điển. Tư duy đã được thực hiện, và công cụ chỉ đang làm mượt dặm cuối cùng của việc thực thi. Nhưng ngay khi bạn sử dụng máy móc để bỏ qua chính tư duy đó, để nó đưa ra các lựa chọn phương pháp luận, để nó quyết định dữ liệu có ý nghĩa gì, để nó viết lập luận trong khi bạn gật gù, bạn đã vượt qua một ranh giới rất khó nhìn thấy và rất khó quay lại. Bạn không tiết kiệm thời gian. Bạn đã từ bỏ trải nghiệm mà đáng lẽ thời gian đó phải mang lại cho bạn.
Natalie Hogg đã diễn tả rất hay trong bài luận của cô ấy, khi cô ấy thừa nhận rằng nỗi sợ sử dụng LLM của cô ấy một phần là nỗi sợ chính bản thân mình: rằng cô ấy sẽ không kiểm tra đầu ra đủ cẩn thận, rằng sự kiên nhẫn của cô ấy sẽ cạn kiệt, rằng cách tiếp cận công việc của cô ấy luôn lộn xộn. Sự trung thực như vậy hiếm khi xuất hiện trong các cuộc thảo luận này, và nó quan trọng. Lỗi chế độ không phải là ác ý. Đó là sự tiện lợi. Đó là xu hướng rất con người chấp nhận một câu trả lời hợp lý và tiếp tục, đặc biệt là khi bạn mệt mỏi, đặc biệt là khi thời hạn sắp đến, đặc biệt là khi máy móc trình bày đầu ra của nó với thẩm quyền tự tin, được định dạng tốt như vậy. Vấn đề không phải là chúng ta sẽ quyết định ngừng suy nghĩ. Vấn đề là chúng ta sẽ hầu như không nhận thấy khi chúng ta làm điều đó.
Tôi không lập luận rằng LLM nên bị cấm nghiên cứu. Điều đó thật ngu ngốc, và đó là một lập trường tôi không giữ, vì tôi đã sử dụng một cái sáng nay. Tôi lập luận rằng cách chúng ta sử dụng chúng quan trọng hơn việc chúng ta có sử dụng chúng hay không, và rằng sự khác biệt giữa sử dụng công cụ và thuê ngoài nhận thức là đường kẻ quan trọng nhất trong toàn bộ cuộc trò chuyện này, và hầu như không ai vẽ nó một cách rõ ràng. Schwartz có thể sử dụng Claude để viết một bài báo vì Schwartz đã biết vật lý. Hàng thập kỷ kinh nghiệm của ông ấy là hệ miễn dịch giúp bắt các ảo giác của Claude. Một sinh viên năm nhất sử dụng cùng một công cụ, cho cùng một vấn đề, với cùng một người giám sát đưa ra cùng một phản hồi, tạo ra kết quả giống nhau mà không có bất kỳ sự thấu hiểu nào. Bài báo trông giống hệt nhau. Nhà khoa học thì không.
Và đây là lúc tôi phải công bằng với Bob, vì Bob không phải là kẻ ngốc. Bob đang phản ứng một cách hợp lý với những ưu đãi mà anh ấy nhận được. Học thuật là một cuộc cạnh tranh khốc liệt. Áp lực "xuất bản hoặc là chết" không phải là một phép ẩn dụ; đó là cơ chế thực tế mà sự nghiệp được tạo dựng hoặc kết thúc. Đã xa rồi cái thời mà một chuyên luận đơn lẻ, được suy luận cẩn thận có thể giúp bạn hoàn thành bằng Tiến sĩ và có được một vị trí postdoc tốt. Tuyển dụng học thuật hiện nay đề cao khối lượng xuất bản. Bạn càng xuất bản nhiều bài báo trong quá trình học Tiến sĩ, cơ hội bạn có được một vị trí postdoc cạnh tranh càng cao, điều này lại cải thiện cơ hội có được một suất học bổng tốt, từ đó cải thiện cơ hội có được một vị trí biên chế (tenure-track), mỗi bước đi sẽ củng cố bước đi trước đó (quá nhiều cấp bậc, gần giống như một kim tự tháp). Vậy tại sao một sinh viên năm nhất lại không thuê ngoài việc suy nghĩ của mình cho một tác nhân, nếu làm như vậy có nghĩa là ba bài báo thay vì một? Logic là hoàn hảo, cho đến khoảnh khắc nó không còn vậy nữa. Bởi vì cùng một con đường sự nghiệp đề cao khối lượng xuất bản ban đầu cuối cùng sẽ đòi hỏi một thứ mà không tác nhân nào có thể cung cấp: khả năng xác định một vấn đề tốt, biết khi nào một kết quả có vẻ sai, giám sát công việc của người khác với sự tự tin chỉ đến từ việc bạn đã tự mình làm điều đó. Bạn không thể bỏ qua năm năm học đầu tiên và mong đợi tồn tại trong hai mươi năm tiếp theo. Không có cách nào để tránh cuộc đua "xuất bản hoặc là chết" nếu bạn muốn có một sự nghiệp học thuật. Nhưng có một sự cân bằng cần đạt được, và nó đòi hỏi điều khó nhất khi bạn hai mươi bốn tuổi và lo lắng về tương lai của mình: ưu tiên sự hiểu biết dài hạn hơn là sản lượng ngắn hạn. Chưa ai giỏi về điều đó cả. Tôi không chắc tại sao chúng ta lại bắt đầu bây giờ.
Năm năm nữa, Alice sẽ tự viết các đề xuất xin tài trợ, tự chọn vấn đề, tự giám sát các sinh viên của mình. Cô ấy sẽ biết những câu hỏi nào cần hỏi vì cô ấy đã dành một năm để học một cách khó khăn điều gì sẽ xảy ra khi hỏi sai. Cô ấy sẽ có thể nhìn vào một bộ dữ liệu mới và cảm nhận, trong lòng, khi có điều gì đó không ổn, bởi vì cô ấy đã phát triển trực giác chỉ đến từ việc tự mình làm việc đó, từ những giờ gỡ lỗi nhàm chán, từ những buổi chiều lãng phí theo đuổi các lỗi dấu, từ sự tích lũy chậm rãi kiến thức ngầm mà không bản tóm tắt nào có thể truyền đạt được.
Bob sẽ ổn thôi. Anh ấy sẽ có một CV tốt. Anh ấy có lẽ sẽ có một công việc. Anh ấy sẽ sử dụng phiên bản Claude năm 2031, và anh ấy sẽ tạo ra kết quả, và những kết quả đó sẽ trông giống như khoa học.
Tôi không lo lắng về máy móc. Máy móc ổn thôi. Tôi lo lắng về chúng ta.
Nếu bài đăng này mang lại cho bạn điều gì đó để suy ngẫm và bạn muốn hỗ trợ nhiều bài viết như thế này hơn, bạn có thể mua cho tôi một ly cà phê.
Tài liệu tham khảo:
D. W. Hogg, "Why do we do astrophysics?", arXiv:2602.10181, tháng 2 năm 2026.
N. B. Hogg, "Find the stable and pull out the bolt", tháng 2 năm 2026. Có sẵn tại nataliebhogg.com.
M. Schwartz, "Vibe physics: The AI grad student", Anthropic Science Blog, tháng 3 năm 2026. Có sẵn tại anthropic.com/research/vibe-physics.
Tác giả: zaikunzhang