Bên trong thuật toán của TikTok - người dùng bị gây nghiện như thế nào?

Nếu không nhờ thuật toán AI đề xuất nội dung này, các video thời lượng ngắn với nội dung đầy kích thích của TikTok sẽ khó có thể phổ biến trên khắp thế giới như hiện nay.

TikTok như một cơn bão gây nghiện đang quét qua toàn cầu. Cùng với hàng tỷ người dùng trẻ bị cuốn theo cơn bão này, những mạng xã hội khổng lồ trên toàn cầu cũng phải chạy theo cơn bão do những đoạn clip ngắn trên TikTok gây nên. Nhưng cho đến giờ, dường như vẫn chưa ai có thể lặp lại được cơn sốt gây nghiện mà TikTok tạo ra trong thời gian qua.

Đó là vì các công ty đối thủ mới chỉ sao chép TikTok ở việc tạo ra những đoạn video ngắn, còn làm thế nào để "gây nghiện" cho người dùng lại là câu chuyện hoàn toàn khác. Bí quyết nằm ở thuật toán đề xuất nội dung cho người dùng. Nhưng vào tháng 9 gần đây, trong một động thái làm nhiều người bất ngờ, Bytedance, công ty mẹ của TikTok đã công bố thiết kế cho hệ thống đề xuất nội dung được sử dụng trong ứng dụng nổi tiếng này.

Bên trong thuật toán của TikTok - người dùng bị gây nghiện như thế nào? - Ảnh 1.

Nguồn internet

Điều này nằm trong nỗ lực của Bytedance nhằm biến hệ thống đề xuất nội dung này thành một dịch vụ thuê bao đám mây dành cho các khách hàng doanh nghiệp. Nhờ đó, thế giới mới có cái nhìn rõ ràng hơn về cách thức TikTok gây nên "cơn nghiện" đối với người dùng khắp toàn cầu.

Monolith: Hệ thống AI đề xuất nội dung của TikTok

Trong khi thuật toán của Facebook dựa trên "social graph" – mạng lưới kết nối xã hội – của người dùng, hay mức độ tương tác của họ với những người khác để đưa ra các đề xuất nội dung tương tự để giữ chân người dùng, thuật toán đề xuất của TikTok tập trung vào tương tác giữa người dùng với chính nội dung đó, được đặt tên hệ thống Monolith.

Bên trong thuật toán của TikTok - người dùng bị gây nghiện như thế nào? - Ảnh 2.

Kiến trúc huấn luyện trực tuyến của Monolith với 2 giai đoạn: huấn luyện sơ bộ và huấn luyện trực tuyến. Nguồn: ByteDance.

Về tổng thể, kiến trúc của Monolith tuân theo thiết lập phân tán của TensorFlow – một thư viện phần mềm mã nguồn mở của Google dành cho máy học và trí tuệ nhân tạo, vốn được tạo ra để dành cho việc huấn luyện học sâu các mạng lưới thần kinh nhân tạo.

Đối với Monolith, quá trình huấn luyện được chia thành 2 giai đoạn: huấn luyện sơ bộ (Batch Training) với việc nạp các dữ liệu đầu vào cho hệ thống cùng các tham số cơ bản. Các dữ liệu này được lấy từ những thông tin như thiết lập ngôn ngữ, quốc gia hay loại thiết bị.

Nhưng một phần quan trọng khác là các lựa chọn ban đầu của người dùng đối với chủ đề video mà họ quan tâm. Từ các chủ đề này, TikTok đề xuất ra một loạt các nội dung tương ứng với cấp độ ngang hàng nhau – từ của người dùng mới đăng tải cho đến nội dung của những người có ảnh hưởng.

Tiếp đó hệ thống phân tích phản hồi của người dùng đối với nội dung được đề xuất và đánh giá chất lượng của nội dung đó dựa trên các tham số bao gồm: số lượng like, lượt xem, thời gian xem, số bình luận, lượt repost, lượt share, mức độ gia tăng người theo dõi, … Các nội dung thuộc top 10% điểm số cao nhất sẽ được ưu tiên hiển thị.

Nhưng không dừng lại ở đó, hệ thống Monolith còn trải qua quá trình huấn luyện trực tuyến với các dữ liệu liên tục được nạp vào theo thời gian thực. Sau khi một mô hình được xây dựng dựa trên các dữ liệu đưa vào từ giai đoạn huấn luyện sơ bộ, nó tiếp tục được cập nhật dựa trên các dữ liệu đưa vào theo thời gian thực. Các tham số về phản hồi của người dùng cũng được cập nhật và đồng bộ theo thời gian thực để hệ thống đưa ra các tác động gần như ngay lập tức đến người dùng.

Bên trong thuật toán của TikTok - người dùng bị gây nghiện như thế nào? - Ảnh 3.

Vòng lặp thông tin phản hồi của hệ thống huấn luyện Monolith: Ở giai đoạn huấn luyện sơ bộ [Người dùng - Máy chủ mô hình - máy chủ huấn luyện - máy chủ mô hình - người dùng], thời gian vòng lặp kết thúc kéo dài hơn trong khi giai đoạn huấn luyện trực tuyến, vòng lặp gần như kết thúc ngay lập tức. Nguồn ByteDance

Để đánh đổi khả năng huấn luyện liên tục với tốc độ cao, hệ thống Monolith được TikTok thiết kế với việc chấp nhận tỷ lệ lỗi cao hơn (fault Tolerance) – hay nói cách khác, công ty chấp nhận giảm độ chính xác trong mô hình của mình để các tham số được đồng bộ liên tục nhanh hơn, với băng thông mạng lớn hơn và đưa ra kết quả theo thời gian thực đáng tin cậy hơn.

Tương tự thuật toán đề xuất của Facebook, tương tác của người dùng đối với nội dung được đánh giá thông qua các hành vi khi like, share hoặc bình luận dưới đoạn video. Nhưng yếu tố then chốt trong thuật toán của TikTok là thời gian người dùng xem video. Điều này được thể hiện trong chính tài liệu do TikTok công bố:

"Các ID chỉ dành một ít thời gian (với đoạn video được đề xuất) sẽ có ít đóng góp cho việc cải thiện chất lượng mô hình," ngoài ra các ID "có thời hạn sử dụng từ lâu hiếm khi đóng góp vào mô hình hiện tại khi phần nhiều trong số chúng không bao giờ được truy cập. Điều này có thể là vì người dùng đã không còn hoạt động hoặc đoạn video ngắn đã lỗi thời."

Trong khi các hành vi người dùng như like, chia sẻ, bình luận không phải lúc nào cũng xuất hiện trong mỗi đoạn video được đề xuất, do vậy thời gian xem đoạn video vẫn được TikTok xem là yếu tố then chốt để đánh giá mức độ ưa thích của người dùng đối với đoạn video đó.

Bên trong thuật toán của TikTok - người dùng bị gây nghiện như thế nào? - Ảnh 4.

Ảnh Internet

Hệ lụy của thiết kế gây nghiện cho người dùng

Trên thực tế, mọi nền tảng mạng xã hội đều được thiết kế để giữ chân người dùng ở lại càng lâu càng tốt. Nhưng có thể thấy thuật toán đề xuất của TikTok được thiết kế để tập trung vào phản hồi của người dùng đối với nội dung được hiển thị - thay vì dựa vào mối quan hệ tương tác giữa người dùng với nhau như cách làm của Facebook.

Điều này kéo theo một hệ lụy khác trong hệ thống đề xuất nội dung của TikTok đối với người dùng: đó là duy trì tương tác của người dùng bằng cách "gây nghiện" cho họ. Còn cách nào tốt hơn để kéo dài thời gian xem video và tương tác của người dùng bằng cách đề xuất các nội dung gây kích thích hợp chất dopamin trong não bộ - một hợp chất được giải phóng mỗi khi bạn nhận được điều gì đó gây thích thú.

Trên thực tế, thiết kế giữ chân người dùng của TikTok cũng tương tự như YouTube. Nhưng khác biệt nằm trong thiết kế giao diện của 2 ứng dụng này. Trong khi YouTube ban đầu dành cho người dùng máy tính sau đó mới được thiết kế cho smartphone, do đó các video có thời lượng dài với giao diện mặc định chỉ chiếm một phần màn hình còn lại là không gian cho các đề xuất video khác.

Bên trong thuật toán của TikTok - người dùng bị gây nghiện như thế nào? - Ảnh 5.

Ảnh Internet

Còn với TikTok, các video có thời lượng rất ngắn, giao diện mặc định chiếm trọn vẹn màn hình điện thoại, thu hút toàn bộ sự chú ý của người dùng. Với các nội dung liên tục kích thích sự chú ý trong thời gian ngắn, một chuỗi liên tục các video như vậy có thể hút cạn sự tập trung của người dùng, gần như thực sự "gây nghiện" khi khiến họ không thể rời mắt khỏi màn hình điện thoại.

Chạy theo việc gây nghiện cho người dùng càng nhiều càng tốt sẽ không chỉ tạo ra các video với hình ảnh, âm thanh ngày càng cuốn hút, mà cũng kéo theo nhiều nội dung "rác" hoặc gây tranh cãi mạnh mẽ trong cộng đồng. Khi lôi kéo được nhiều tương tác, hệ thống đề xuất của TikTok sẽ nhanh chóng đưa nó lên hàng đầu trong số các nội dung được ưu tiên hiển thị và lan truyền rộng rãi tới người dùng khác – bất kể họ là ai hay mối quan tâm là gì.

Cho dù TikTok thường xuyên phải xóa một số lượng lớn video do vi phạm "Tiêu chuẩn cộng đồng" của mình. Riêng quý 2/2022, TikTok cho biết đã xóa 113 triệu video vi phạm. Đây là một mức gia tăng khổng lồ khi trong 6 tháng cuối năm 2019, số lượng video xóa khỏi nền tảng này chỉ ở con số 49 triệu. Số lượng video bị xóa cho thấy, tốc độ tăng trưởng khủng khiếp của các nội dung rác trên nền tảng này lớn đến mức nào. Hơn thế nữa, con số này còn chưa bao gồm vô số nội dung rác khác chưa bị phát hiện và xóa bỏ trước khi phát tán rộng rãi trên nền tảng này.