לקראת הבחירות בארה"ב: חוקרים מבן גוריון מסבירים כיצד נוכל לזהות "פייק ניוז"
28.10.24 / 16:35
"פייק ניוז" הן בעיה מוכרת, ההולכת וגוברת בסמוך לקיומן של מערכות בחירות, בשל ההשפעה על ציבור הבוחרים באמצעות מידע מוטעה ותיאוריות קונספירציה. בעוד הקרב בין המתמודדים על נשיאות ארה"ב צמוד מתמיד, חוקרים מאוניברסיטת בן-גוריון בנגב פיתחו שיטה שתסייע לוודא עובדות בתוך כמות המידע שעוברת ברשתות החברתיות. עקרונות השיטה פורסמו בכנס הבינלאומי המוביל KDD.
האופי הדינמי וכמות המידע העוברת ברשת האינטרנט, הופכת את פעולת הזיהוי של מידע מוטעה בזמן אמת למשימה קשה ביותר. קבוצת המחקר של ד"ר ניר גרינברג ופרופ' רמי פוזיס מהמחלקה להנדסת מערכות תוכנה ומידע באוניברסיטת בן-גוריון בנגב, פיתחו שיטה באמצעות לימוד מכונה לאיתור מקורות מידע מזויפים.
השיטה מבוססת על למידת מכונה פעילה שמתבססת על מאפייני התוכן שמופץ, המשתמשים שמפיצים אותו ומבנה הרשת של צרכני התוכן השקרי. החוקרים בחנו את הצלחת השיטה גם רטרואקטיבית וגם לאורך הזמן, ולמעשה דימו את אופן שבו בודקי עובדות בני אנוש נדרשים לזהות מידע שקרי.
כך למשל, נמצא שמעקב אחר אתרי חדשות מזויפים, ולא מאמרים או פוסטים בודדים, יכולים להוריד משמעותית את העומס על בודקי העובדות ולהניב תוצאות אמינות לאורך זמן. המודל ידע גם להבדיל בין מונחים טקסטואליים ארעיים לעומת מונחים מוכרים לאורך זמן. עוד נמצא שתיוג מקורות פופולריים עשוי מתייחס לשקרים הנפוצים ביותר בכלל האוכלוסייה, אבל הוא בעייתי לזיהוי מקורות "פייק" חדשים שהרבה פעמים עולים בקהילות מסוימות בהן יש ביקוש לתוכן מסוג זה.
"הבעיה כיום עם התפשטות החדשות המזויפות היא שבודקי העובדות מוצפים. הם לא יכולים לבדוק הכל, אבל היקף הכיסוי שלהם בתוך ים של תכני מדיה חברתית אינו ברור. יתר על כן, איננו יודעים האם בודקי עובדות מצליחים להגיע דווקא לתוכן החשוב ביותר לבדיקה, מה שהוביל אותנו לפתח גישת למידת מכונה שיכולה לעזור לבודקי עובדות להפנות את תשומת הלב שלהם טוב יותר ולהגביר את הפרודוקטיביות שלהם", מסביר ד"ר גרינברג.
מקורות של "פייק ניוז" נוטים להופיע ולהיעלם במהירות במהלך השנים, כך שתחזוקת רשימות של אתרים אלו כרוכה בעלות ובעבודה רבה. המערכת שלהם מחשיבה את זרימת המידע ברשתות החברתיות ואת הקהל התאב למידע מעין זה. המודלים שפותחו עד כה מבוססים על הגישה הנפוצה של זיהוי אלו החולקים מידע מוטעה. כעת, החוקרים הצביעו על כך שהשיטה שלהם יכולה לשמור על אותה רמת דיוק (80% במדד PR-AUC) בזיהוי מקורות מזויפים, תוך שהיא דורשת פחות מרבע מהעלות של בדיקת כלל המקורות.
"המערכת לעולם לא תחליף את בודקי העובדות האנושיים, אך השיטה יכולה להציף מקורות חדשים שלכאורה דורשים תשומת שלב של בודקי העובדות כיום", ציין פרופ' פוזיס. "כעת, יש בידי הרשתות החברתיות כלי נוסף שיאפשר להילחם במידע מוטעה".
אנו מכבדים זכויות יוצרים ועושים מאמץ לאתר את בעלי הזכויות בצילומים המגיעים לידינו. אם זיהיתים בפרסומינו צילום שיש לכם זכויות בו, אתם רשאים לפנות אלינו ולבקש לחדול מהשימוש באמצעות כתובת המייל:ram@isnet.co.il