Facebook đã xuất bản một bài báo giải thích cách thức hoạt động của thuật toán Facebook News Feed. So với bằng sáng chế thuật toán nguồn cấp tin tức của Facebook, cả hai tài liệu giải thích nhiều về cách Facebook xếp hạng các bài đăng trong nguồn cấp tin tức.

Học máy và xếp hạng

Thuật toán nguồn cấp tin tức của Facebook là một hệ thống xếp hạng máy học. Tuy nhiên, nó không chỉ là một thuật toán. Đó là sự kết hợp của nhiều thuật toán hoạt động cùng nhau trong các giai đoạn khác nhau.

Các phần của thuật toán thực hiện những việc khác nhau, chẳng hạn như chọn các bài đăng “ứng cử viên” để hiển thị trong nguồn cấp dữ liệu tin tức của một người, loại bỏ các bài đăng có thông tin sai lệch hoặc chiêu dụ, tạo danh sách bạn bè mà một người tương tác, các chủ đề mà người đó có xu hướng tương tác và sau đó sử dụng tất cả các yếu tố này để xếp hạng (hoặc không xếp hạng) bài đăng trong nguồn cấp tin tức Facebook.

Tất cả các lớp khác nhau đó đều được áp dụng để dự đoán những gì một thành viên Facebook sẽ tìm thấy có liên quan đến họ.

Mục tiêu của các thuật toán là xếp hạng bài đăng nào hiển thị trong nguồn cấp tin tức, thứ tự của chúng và chọn bài đăng mà một thành viên Facebook có khả năng quan tâm và tương tác.

Nó không chỉ là một vài tín hiệu được xem xét. Facebook tuyên bố rằng họ sử dụng hàng nghìn tín hiệu.

Theo Facebook:

“Đối với mỗi người trên Facebook, có hàng nghìn tín hiệu mà chúng tôi cần đánh giá để xác định những gì người đó có thể thấy phù hợp nhất… để dự đoán những gì mỗi người trong số những người đó muốn xem trong nguồn cấp dữ liệu của họ…”

Tín hiệu xếp hạng nguồn cấp tin tức Facebook

Đặc điểm của một bài đăng trên Facebook

Một trong những tín hiệu xếp hạng mà Facebook thảo luận là “đặc trưng”Của một bài đăng.

Facebook đang sử dụng một tính năng hoặc chất lượng của một bài đăng và xác định xem đây có phải là loại thứ mà người dùng có xu hướng tương tác nhiều hơn hay không.

Ví dụ: nếu một bài đăng đi kèm với hình ảnh nhiều màu sắc và một thành viên có lịch sử tương tác với các bài đăng có hình ảnh nhiều màu sắc, thì điều đó sẽ được xếp hạng cao hơn.

Nếu một bài đăng có kèm theo video và đó là nội dung mà thành viên Facebook thích tương tác, thì thành viên đó sẽ được xếp hạng cao hơn.

Cho dù bài đăng có hình ảnh, video hay không, bạn bè của người dùng có được gắn thẻ trong bài đăng hay không, thì những đặc điểm đó và các đặc điểm khác của bài đăng được sử dụng làm yếu tố xếp hạng để xác định liệu bài đăng có được hiển thị cho người dùng hay không và xếp hạng nó sẽ được xếp hạng trong nguồn cấp tin tức.

Facebook đã sử dụng ví dụ về một người dùng hư cấu tên là Juan (tên “John” trong tiếng Tây Ban Nha) để minh họa yếu tố xếp hạng đặc điểm.

Đây là những gì Facebook đã nói về yếu tố xếp hạng đặc điểm:

“Chúng tôi có thể sử dụng các đặc điểm của một bài đăng, chẳng hạn như ai được gắn thẻ trong ảnh và thời điểm nó được đăng, để dự đoán liệu Juan có thích nó hay không.

Ví dụ: nếu Juan có xu hướng tương tác với các bài đăng của Saanvi (ví dụ: chia sẻ hoặc bình luận) thường xuyên và video đang chạy của cô ấy rất gần đây, thì khả năng cao là Juan sẽ thích bài đăng của cô ấy.

Nếu trước đây Juan tương tác với nhiều nội dung video hơn ảnh, thì dự đoán tương tự đối với bức ảnh của Wei về chú chó vẹt đuôi dài của anh ta có thể khá thấp.

Trong trường hợp này, thuật toán xếp hạng của chúng tôi sẽ xếp hạng video đang chạy của Saanvi cao hơn ảnh con chó của Wei vì nó dự đoán xác suất cao hơn rằng Juan sẽ thích nó ”.

Thời gian là một yếu tố xếp hạng của Facebook

Ví dụ của Facebook đã được lưu ý ở trên cũng minh họa thời gian, dưới dạng cách một nội dung được đăng gần đây, cũng có thể được sử dụng như một yếu tố xếp hạng.

Điều thú vị về ví dụ hư cấu “Juan” là Facebook đã đề cập rằng thời điểm một bài đăng được thực hiện là một yếu tố xếp hạng.

“Chúng tôi có thể sử dụng các đặc điểm của một bài đăng, chẳng hạn như ai được gắn thẻ trong ảnh và thời điểm nó được đăng, để dự đoán liệu Juan có thích nó hay không”.

Khía cạnh thời gian như một yếu tố xếp hạng trùng khớp với một bằng sáng chế tương đối gần đây của Facebook tuyên bố rằng nội dung nào đó đã được đăng gần đây có thể được sử dụng như một yếu tố xếp hạng.

Bằng sáng chế về nguồn cấp tin tức của Facebook có tên là Lựa chọn và Trình bày các Câu chuyện Tin tức Xác định Nội dung Bên ngoài cho Người dùng Hệ thống Mạng Xã hội.

Đây là những gì bằng sáng chế Nguồn cấp tin tức Facebook cho biết:

“… Các tin bài có thể được xếp hạng dựa trên dữ liệu theo trình tự thời gian liên quan đến các tương tác với các tin bài, để các tin bài được chia sẻ gần đây nhất có thứ hạng cao hơn.”

Điều đó dường như xác nhận giá trị của việc đăng cùng một bài nhiều hơn một lần trong suốt một ngày. Nó có thể tiếp cận những người khác nhau trong các khoảng thời gian và những người tương tác với bài đăng có thể giúp nó được hiển thị cho bạn bè của họ, v.v.

Sự tham gia và sự quan tâm

Một yếu tố xếp hạng khác liên quan đến việc dự đoán liệu người dùng có thể sẽ quan tâm hoặc tương tác với một bài đăng hay không. Facebook sử dụng một số tín hiệu để đưa ra dự đoán đó.

Bài viết rõ ràng về điểm đó:

“… Hệ thống xác định bài đăng nào hiển thị trong Bảng tin của bạn và theo thứ tự, bằng cách dự đoán những gì bạn có khả năng quan tâm hoặc tương tác nhất.”

Và một số yếu tố mà Facebook sử dụng là tín hiệu từ các bài đăng trước đây và những người mà người dùng đã tương tác. Facebook sử dụng những tương tác trong quá khứ này để giúp dự đoán những gì người dùng sẽ tương tác trong tương lai.

Theo Facebook:

“Những dự đoán này dựa trên nhiều yếu tố, bao gồm những gì và những người bạn đã theo dõi, thích hoặc đã tương tác gần đây”.

Facebook sử dụng mô hình học máy để dự đoán từng điều khác nhau. Có một mô hình dự đoán nội dung người dùng sẽ thích, một mô hình khác dự đoán bài đăng mà người dùng sẽ nhận xét.

Mỗi hình thức tham gia này đều nhận được điểm xếp hạng và sau đó được xếp hạng.

Tóm lại, quá trình xếp hạng bắt đầu bằng cách xác định các bài đăng ứng viên để xếp hạng, từ một nhóm các bài đăng đã được thực hiện kể từ lần đăng nhập cuối cùng của người dùng.

Bước tiếp theo là ấn định điểm xếp hạng cho mỗi bài đăng.

Đây là cách Facebook giải thích nó bằng cách sử dụng một ví dụ về một người dùng hư cấu tên là Juan:

“Tiếp theo, hệ thống cần cho điểm từng bài đăng đối với nhiều yếu tố, chẳng hạn như loại bài đăng, độ tương đồng với các mục khác và mức độ phù hợp của bài đăng với những gì Juan có xu hướng tương tác.

Để tính toán điều này cho hơn 1.000 bài đăng, cho mỗi người trong số hàng tỷ người dùng – tất cả đều theo thời gian thực – chúng tôi chạy các mô hình này cho tất cả các câu chuyện ứng viên song song trên nhiều máy, được gọi là máy dự đoán. ”

Tín hiệu xếp hạng được cá nhân hóa cho người dùng

Một thông tin chi tiết thú vị về các yếu tố xếp hạng là chúng có trọng số khác nhau từ người dùng này sang người dùng tiếp theo. Có trọng số nghĩa là khi một tín hiệu xếp hạng quan trọng hơn một tín hiệu xếp hạng khác.

Những gì Facebook tiết lộ là đối với một người, dự đoán rằng họ sẽ “thích” một bài đăng có thể có ảnh hưởng mạnh mẽ hơn đến việc bài đăng đó có được xếp hạng hay không.

Đối với một người dùng khác, dự đoán rằng người dùng sẽ nhận xét về một bài đăng có trọng số xếp hạng cao hơn.

Facebook đã chia sẻ:

“Tiếp theo là đường chuyền ghi bàn chính, nơi mà hầu hết các cá nhân hóa diễn ra.

Ở đây, điểm cho mỗi câu chuyện được tính một cách độc lập và sau đó tất cả 500 bài đăng được xếp theo thứ tự điểm.

Đối với một số người, điểm số cho lượt thích có thể cao hơn so với nhận xét, vì một số người thích thể hiện bản thân thông qua lượt thích hơn là bình luận.

Bất kỳ hành động nào mà một người hiếm khi tham gia (ví dụ: một dự đoán tương tự rất gần bằng 0) sẽ tự động có vai trò tối thiểu trong xếp hạng, vì giá trị dự đoán là rất thấp. “

Điều đó có nghĩa là để một bài đăng thành công, bài đăng đó phải truyền cảm hứng cho các hình thức tương tác khác nhau từ mọi người dùng.

Các tính năng theo ngữ cảnh cho sự đa dạng của News Feed

Bước cuối cùng trong quá trình xếp hạng là đảm bảo tính đa dạng của loại nội dung được hiển thị trong nguồn cấp tin tức. Bằng cách đó, nguồn cấp dữ liệu của người dùng không bị lặp lại.

Nhiều yếu tố xếp hạng trên Facebook được cá nhân hóa

Facebook đã không liệt kê mọi yếu tố xếp hạng được sử dụng để xếp hạng các bài đăng trong một nguồn cấp tin tức. Nhưng họ đã đưa ra một ý tưởng, một cái nhìn tổng quan về quá trình xếp hạng diễn ra như thế nào và những loại hành vi nào được ưu tiên. Chúng tôi cũng đã học được rằng các tín hiệu xếp hạng là động và có thể có trọng số khác nhau tùy thuộc vào từng người.

Trích dẫn

Làm thế nào để News Feed dự đoán những gì bạn muốn xem?

Cách máy học tạo sức mạnh cho thuật toán xếp hạng nguồn cấp dữ liệu tin tức của Facebook

Tuyển chọn và trình bày các câu chuyện tin tức xác định nội dung bên ngoài cho người dùng hệ thống mạng xã hội (PDF)

Tình cảm đối với người dùng hệ thống mạng xã hội (PDF)

Xếp hạng lại nội dung câu chuyện (PDF)

Giải quyết các thực thể từ nhiều nguồn dữ liệu cho hệ thống hỗ trợ (PDF). Chúc bạn có nhiều kiến thức hữu ích khi đọc bài viết của Trung An Corp

Đánh giá post