פייסבוק בונה את העסק שלה על ידי כך שהיא לומדת על המשתמשים שלה ואורזת את המידע עבור מפרסמים. לאחר מכן היא משקיעה מחדש את הכסף כדי להציע לנו פונקציונליות חדשה ושימושית – כעת זה סרטונים וקניות – שהיא משתמשת גם בה כדי ללמוד עלינו יותר.
הדרך שזה מאפשר תקשורת ושיחה בין אנשים הוכחה כבעלת ערך רב עבורנו, ולכן היא הפכה למגנט עבור כמות דאטה עצומה עלינו – מי אנחנו, היכן אנחנו מבזבזים את הזמן שלנו ומה אנחנו אוהבים. הבעיה עבור מדעני הדאטה של פייסבוק, שמנסים למצוא היגיון בכל זה, היא שהרבה מן הדאטה הזה הוא לא מובנה.
עם 1.2 מיליארד אנשים שמעלים 136 אלף תמונות ומעדכנים 293 אלף סטטוסים בכל דקה, עד לאחרונה פייסבוק יכלה לקוות למצוא ערך משבריר קטן מהדאטה הלא מובנה שלה – מידע שלא מכומת באופן פשוט ונמצא בתוך שורות וטבלאות כדי שמחשבים ינתחו אותו.
למידה עמוקה מסייעת להיות חלק בשינוי של המצב הזה. טכניקות של למידה עמוקה מאפשרות למכונות ללמוד לאפיין דאטה בעצמן. דוגמא פשוטה היא כלי לניתוח תמונה באמצעות למידה עמוקה, שיוכל ללמוד לזהות תמונות שכוללות חתולים, מבלי להגיד לו ספציפית איך חתול נראה. באמצעות ניתוח מספר גדול של תמונות, הוא יוכל ללמוד מהתוכן של התמונה – מה עוד בוודאי יהיה בתמונה של חתול? איזה טקסט או מטה-דאטה אולי יציע שתמונה תכלול חתול?
זה מאפשר לתת מבנה לדאטה לא מובנה, על ידי כימות והצגה שלו לתוך מסגרת, שממנה כלים אנליטיים יכולים להסיק תובנות. הם מנסים לענות על שאלות כמו – באיזו תדירות מוצרים של חברה מופיעים בתמונות שמכילות חתולים? האם אנחנו צריכים להתמקד בהצגת הפרסומות שלנו לאנשים שאוהבים חתולים, או לא?
זהו הכלל הבסיסי שבגללו למידה עמוקה היא שימושית עבור פייסבוק, וכאשר אלגוריתמים של למידה עמוקה הופכים ליותר ויותר מתוחכמים, אפשר גם ליישם אותם יותר על כמות מידע גדולה יותר שאנחנו משתפים – מטקסט, דרך תמונות ועד לסרטונים.
הנה כמה דוגמאות למקרים ספציפיים בהם למידה עמוקה נמצאת בשימוש כדי לצבור ערך ולעזור לפייסבוק להשיג את המטרות שלה – לספק נוחות גדולה יותר למשתמשים ולאפשר להם ללמוד יותר עלינו.
כל לייק שלכם הוא כמות מידע עצומה – ומשמעותית במיוחד | צילום: fotolia
1. ניתוח טקסטואלי נתח גדול מהמידע שמשותף בפייסבוק הוא עדיין טקסט. סרטונים אולי מערבים כמויות דאטה גדולות יותר במונחים של מגה בייטס, אבל במונחים של תובנות, הטקסט עדיין יכול להיות עשיר. תמונה יכולה אולי לצייר אלף מילים, אבל אם אתם רוצים רק תשובה פשוטה לשאלה, בדרך כלל לא תצטרכו אלף מילים. כל פיסת דאטה שלא הכרחית לתשובה על השאלה שלכם היא רק רעש, וחשוב מכך – בזבוז של משאבים שצריך לאכסן ולנתח.
פייסבוק משתמשת בכלי שהיא פיתחה בעצמה שנקרא DeepText, כדי לחלץ משמעות ממילים שאנחנו מפרסמים באמצעות למידה, ולדעת כיצד לנתח אותן בהתאם להקשר. רשתות עצביות מנתחות את מערכת היחסים בין מילים כדי להבין כיצד המשמעות שלהן משתנה בהתאם למילים שסביבן. מאחר וזו למידה שהיא מפוקחת למחצה, לאלגוריתמים אין בהכרח הפנייה למידע – מילון לדוגמא – שיסביר את המשמעות של כל מילה. במקום זאת, הם לומדים בעצמם על בסיס השימושים של המילים.
המשמעות היא שהם לא יוכשלו על ידי שינויים באיות, סלנג או שימשו ייחודי בשפה. למעשה, פייסבוק תגיד שהטכנולוגיה היא "אגנוזיה של שפה" – בשל הדרך שהיא מייחסת תוויות למילים, היא יכולה בקלות לעבור בין שפות אנושיות שונות וליישם את מה שהיא למדה מאחת לשנייה.
כיום היא משתמשת בכלי הזה כדי לכוון אנשים למוצרים שהם אולי ירצו לרכוש, על בסיס השיחות שלהם.
2. זיהוי פנים פייסבוק משתמשת באפליקציית למידה עמוקה, DeepFace, כדי ללמד אותה לזהות אנשים בתמונות. לדבריה, הכלי הזה מוצלח יותר מאנשים ביכולת לזהות האם שתי תמונות הן של אותו האדם או לא – כאשר ל-DeepFace 97% הצלחה בהשוואה ל-96% אצל בני אדם.
השימוש בטכנולוגיה הזו הוא שנוי במחלוקת. תומכים בפרטיות אמרו כי הוא הלך רחוק מדי והוא יאפשר לפייסבוק – על בסיס צילום קהל באיכות גבוהה – להדביק שמות לפרצופים רבים, מה שמהווה מכשול ברור לחופש שלנו לנוע במרחב הציבורי באופן אנונימי. המחוקקים האירופאים הסכימו ולחצו על פייסבוק להסיר את הפונקציונליות מחשבונות האזרחים האירופאים ב-2013. אז ענקית המדיה החברתית השתמשה בגרסה מוקדמת של כלי זיהוי הפנים, אשר לא השתמש בלמידה עמוקה. פייסבוק היתה שקטה במידה מסוימת לגבי פיתוח הטכנולוגיה הזו מאז שהיא הגיעה לראשונה לכותרות, ואפשר לשער שהיא מחכה לתוצאות של מקרים משפטיים הנוגעים לפרטיות לפני שהיא תחשוף עוד מידע.
שיעור ההצלחה של זיהוי הפנים של פייסבוק הוא 97% – בהשוואה ל-96% אצל בני אדם | צילום: fotolia
3. פרסום מכוון פייסבוק משתמשת ברשתות עצביות עמוקות – אבני היסוד של למידה עמוקה – כדי להחליט אילו פרסומות להראות לאילו משתמשים. אלו תמיד היו אבני היסוד של העסק שלה, אבל על ידי הטלת המשימה על המכונות עצמן, היא מקווה לבסס טכנולוגיה תחרותית נגד מתחרות הייטק אחרות כמו גוגל, שנאבקות על שליטה באותו שוק.
4. עיצוב יישומים אינטליגנציה מלאכותית פייסבוק אפילו החליטה שהמשימה של קבלת ההחלטות על אילו תהליכים יכולים להשתפר באמצעות אינטיליגנציה מלאכותית (AI) ולמידה עמוקה – תבוצע בידי מכונות. מערכת שנקראת Flow יושמה, והיא משתמשת בניתוח למידה עמוקה כדי להריץ סימולציות של 300 אלף מודלים של למידה עמוקה בכל חודש, כיד לאפשר למהנדסים לבחון רעיונות ואתר הזדמנויות להתייעלות.
קוד פתוח
פייסבוק היא תומכת גדולה בקוד פתוח, ועושה את רוב העבודה שלה באינטליגנציה מלאכותית במעבדות המחקר שלה בה (FAIR), שזמינות לכולם לשימוש או להתאמה. רוב הלמידה העמוקה של פייסבוק נבנית על פלטפורמת Torch, סביבת פיתוח שמתמקדת בפיתוח טכנולוגיות למידה עמוקה ורשתות עצביות. היא גם פתחה את הקוד של עיצוב יחידת מעבד הגרפיקה (GPU) שלה – שמונע על ידי חומרת AI – מחשבים סופר מהירים שמותאמים כדי לבצע משימות למידה עמוקה, שהן בדרך כלל מצריכות כוח רב בשל מספר החישובים העצום שמעורב והמהירות של המידע המתקבל שהם צריכים להתמודד עימה.
מבט אל העתיד
למידה עמוקה בוודאי תמשיך לשחק חלק מרכזי בעתיד הפיתוח של פייסבוק. למרות ששפתיה נעולות לגבי פוטנציאל היישומים החדשים כרגע, רעיונות שעלו לאוויר כוללים יצירה אוטומטית של תיאורי קול תמונות כדי לסייע לעיוורים ולחזות היכן צריך כיסוי גדול יותר – במשימה שלה להעניק גישה לאינטרנט לחלקים עניים בעולם. בטווח הארוך, מעבדות הלמידה העמוקה והאינטליגנציה המלאכותית שלה בוודאי יהוו יתרון לארגונים אחרים גם – בין אם ישירות דרך שימוש בשירותים שלהן, או לא ישירות הודות לתמיכה שלהן בעקרונות קוד פתוח.
|