Tôi đã nghe tập mới nhất của Acquired trên Google [1]. Tôi vẫn chưa nghe hết tập; tôi đã xem được một nửa tập phim dài bốn tiếng. Như bạn có thể hình dung, có rất nhiều giai thoại thú vị từ chuỗi mua lại thành công nhất của Google trong những năm qua. Tôi đặc biệt bị thu hút bởi một số dữ liệu từ những ngày đầu của YouTube.
Sau khi được Google mua lại, YouTube tạo ra doanh thu 30 triệu đô la nhưng lại lỗ 1 tỷ đô la mỗi năm. Ngày nay, chúng ta có thể đã quen với những con số như vậy, nhưng Giám đốc Tài chính của Google đã rất lo lắng trước những khoản lỗ khổng lồ này. Trích từ podcast:
Số tiền họ mất gần như chính xác bằng một xu cho mỗi lượt xem . Vậy nên hãy tưởng tượng mỗi lần bạn tải YouTube trong những năm đó, Google lại chỉ cần vứt một xu xuống cống. Họ phải tìm ra cách giải quyết vấn đề này. Vì vậy, trong vài năm đầu, giám đốc tài chính lúc đó đã rất lo sợ về việc nó mở rộng quy mô. Kiểu như, làm ơn đừng mở rộng quy mô ở trạng thái hiện tại. Nhưng tất nhiên, họ không thể làm gì được. Bí mật đã bị lộ. Đó là mở rộng quy mô. Và giám đốc tài chính đã cân nhắc, này, chúng ta có thể bán nó cho một trong những công ty khác đang đấu thầu không? Đúng vậy. Bởi vì Yahoo và các công ty truyền thông cũng muốn mua YouTube.
Trong bối cảnh này, rõ ràng YouTube từng bị coi là “sai lầm đầu tiên” của Google. Ngày nay, chúng ta có thể cười, nhưng đó là một cảm xúc dễ hiểu nếu bạn có thể du hành thời gian và tưởng tượng mình đang chứng kiến cơ cấu chi phí hoạt động mất cân bằng này vào cuối những năm 2000. Thật dễ dàng để đồng cảm với nỗi lo sợ của giám đốc tài chính về việc YouTube mở rộng quy mô khi tôi nghe Acquired đề cập rằng YouTube vào năm 2007 đã tiêu thụ lượng băng thông bằng toàn bộ Internet vào năm 2000. Ngay cả vào năm 2014, YouTube vẫn chiếm 20% lượng dữ liệu trên Internet.
May mắn thay, YouTube cuối cùng đã tìm ra cách kiếm tiền hiệu quả từ sự chú ý tổng hợp này. Trong Quý 3 năm 2024 [2] , YouTube đã vượt mốc 50 tỷ đô la doanh thu LTM. Quan trọng hơn, tôi nghĩ YouTube có thể chứng tỏ là tài sản internet tiêu dùng bền vững nhất. Khi xem báo cáo [3] minh bạch gần đây của Meta , tôi nhận thấy YouTube là tên miền được xem nhiều nhất trên Facebook trong Quý 2 năm 2025 .

Điều khá thú vị là giá trị của YouTube đối với Google có thể vượt xa doanh thu và lợi nhuận của chính YouTube. Vài tháng trước, Jack Morris đã nêu quan điểm [5] rằng ” Không có ý tưởng mới nào trong AI… Chỉ có bộ dữ liệu mới” và YouTube sẽ chứng minh mình là kho báu của “bộ dữ liệu mới”. Trích từ bài đăng của ông :
Sự đột phá của chúng ta có lẽ sẽ không đến từ một ý tưởng hoàn toàn mới, mà là sự tái hiện lại một điều gì đó mà chúng ta đã biết từ lâu.
Nhưng vẫn còn thiếu một phần ở đây: mỗi một trong bốn đột phá này đều cho phép chúng ta học hỏi từ một nguồn dữ liệu mới:
1. AlexNet và các phiên bản tiếp theo đã mở khóa ImageNet , một cơ sở dữ liệu lớn về các hình ảnh được gắn nhãn theo lớp đã thúc đẩy mười lăm năm tiến bộ trong lĩnh vực thị giác máy tính
2. Transformers mở khóa đào tạo về “Internet” và cuộc đua tải xuống, phân loại và phân tích tất cả văn bản trên Web ( có vẻ như chúng tôi đã thực hiện phần lớn bây giờ )
3. RLHF cho phép chúng tôi học hỏi từ các nhãn của con người chỉ ra thế nào là “văn bản hay” (chủ yếu là một thứ rung cảm)
4. Lý luận dường như cho phép chúng ta học hỏi từ “người xác minh” [6] , những thứ như máy tính và trình biên dịch có thể đánh giá đầu ra của các mô hình ngôn ngữ
…Điều hiển nhiên rút ra là sự thay đổi mô hình tiếp theo của chúng ta sẽ không đến từ việc cải tiến thực tế ảo (RL) hay một loại mạng nơ-ron mới lạ. Nó sẽ đến khi chúng ta khai phá một nguồn dữ liệu mà trước đây chúng ta chưa từng truy cập, hoặc chưa được khai thác đúng cách.
Một nguồn thông tin rõ ràng mà nhiều người đang nỗ lực khai thác chính là video. Theo một trang web ngẫu nhiên trên mạng [7] , trung bình mỗi phút có khoảng 500 giờ video được tải lên YouTube. Đây là một lượng dữ liệu khổng lồ, lớn hơn nhiều so với lượng dữ liệu văn bản có sẵn trên toàn bộ Internet. Tuy nhiên, đây cũng có tiềm năng là một nguồn thông tin phong phú hơn nhiều, bởi video không chỉ chứa từ ngữ mà còn chứa cả ngữ điệu đằng sau chúng, cũng như những thông tin phong phú về vật lý và văn hóa mà văn bản không thể nào truyền tải hết được.
Có thể nói chắc chắn rằng ngay khi các mô hình của chúng tôi đủ hiệu quả, hoặc máy tính của chúng tôi đủ mạnh, Google sẽ bắt đầu đào tạo các mô hình trên YouTube. Suy cho cùng, họ sở hữu thứ này; thật ngớ ngẩn nếu không tận dụng dữ liệu để tạo lợi thế cho mình.
Vì vậy, chắc chắn là có khả năng “sai lầm đầu tiên” của Google cuối cùng có thể trở thành vị cứu tinh thực sự của công ty.
Nguồn:
1. https://www.youtube.com/watch?v=QhAftC_zFr8
2. https://variety.com/2024/digital/news/youtube-q3-2024-advertising-revenue-growth-1236193926/
3/ https://transparency.meta.com/en-gb/data/widely-viewed-content-report/#prior-reports
4. https://transparency.meta.com/en-gb/data/widely-viewed-content-report/#prior-reports
5. https://blog.jxmo.io/p/there-are-no-new-ideas-in-ai-only?
6. http://incompleteideas.net/IncIdeas/KeytoAI.html?utm_source=substack&utm_medium=email
7. https://www.dexerto.com/entertainment/how-many-videos-are-there-on-youtube-2197264/

