במבט לאחור על 2018, אין ספק כי זו היתה שנה שבה הבינה מלאכותית המשיכה את הצמיחה המטאורית שלה בנוף הדיגיטלי, ופיזרה את כוחות הקסם שלה כמעט בכל פינה של התעשייה. היא יצרה מהפכה באופן שבו החברה משתמשת בנתונים. אם כך, ניתן להבין מדוע חברות גדולות וקטנות מיהרו להציג השנה כיצד הן רתמו את תחום הלמידה העמוקה (Deep Learning) כדי לשפר את התהליכים העסקיים שלהן. המציאות היא שבעוד שבינה מלאכותית אכן שינתה תחומים כמו זיהוי אור-קולי, נתנה לנו כלים חדשים ורבי עוצמה להבנת השפה והציעה הצצה ראשונה לאלגוריתמים בעלי אינטואיציה – במציאות, הרוב המכריע של יישומי ה-AI המסחריים הציג עד כה שיפור מזערי ביחס לגישות המסורתיות.
כשאנחנו מדברים היום על למידה עמוקה, אנחנו עושים זאת ביראת כבוד ומייחסים לה הילה כמעט מיסטית של יכולת אנושית. חברות ממהרות לפזר את האבק הקסום של AI בכל פרויקט. אפילו קרנות מימון כבר צוללות אל תוך תחום ה-AI בפזיזות, כשהן משתמשות במודלים של למידה עמוקה בכל בעיה. אותן קרנות פעם הרבו להשתמש במונח "מדיה חברתית" בכל הצעה מוצלחת, עכשיו הן מרבות להשתמש במונח "למידה עמוקה".
המודלים העצביים לא תמיד מדויקים יותר | צילום: shutterstock
בתודעה הציבורית נתפסת הבינה המלאכותית כאלגוריתמיקה אנושית שהיא בעצם גרסה ילדותית של עצמנו. זאת מכיוון שמוצרי הבינה המלאכותית משתפרים כל הזמן ואת מגבלות הדיוק שלהם ניתן לתקן באופן מיידי, אם רק היינו מאמנים אותם קצת יותר.
המציאות היא שאלגוריתמי הלמידה העמוקה של ימינו הם יותר אמנות מאשר מדע. שיפור הדיוק לא בא מביצוע אימונים נוספים, אלא מתוך בחירה ידנית וזהירה של נתוני האימון, ביצוע כוונון מסובך, עריכת ניסויים ולעתים קרובות אף מזל. אלגוריתמים מוצלחים הם חידות שאפילו היוצרים שלהם אינם מבינים ואינם יכולים לשכפל באופן אוטומטי לתחומים אחרים. אפילו הדגמים המדויקים ביותר הם לעתים קרובות כל כך שבריריים, שכל שינוי, אפילו הקל ביותר, או התערבות זדונית, יכולים להרוס אותם לחלוטין.
לא כמו מתרגם אנושי
בכמה תחומים, כמו ניתוח אור-קולי, גישות הלמידה העמוקה השתפרה באופן ממשי, ומאפשרות למכונות להשיג רמות דיוק בהבנה ובהפקת תמונות, דיבור וסרטונים. אלו רמות דיוק שלא היה ניתן להעלות על הדעת לפני מספר שנים. מערכות ראייה עצבית יכולות לזהות דגם ומודל מסוים של רכב, גם כאשר הוא מכוסה או ממוגן. המערכות יכולות להבין את ההבדל בין אקדח המונח על השולחן, לבין אקדח המכוון לאוויר ובין אקדח המכוון לאדם. מערכת ראייה עצבית יכולה להעריך את המיקום הגיאוגרפי שבו צולמה התמונה, גם אם זה נראה שונה באופן דרמטי מהתמונות שהיא ראתה במהלך האימונים. יחד עם זאת, שימוש ב-AI לניתוחים טקסטואליים ומספרים, לא תמיד מראה רמת שיפור גבוהה. בדומה לתרגום המכונה הסטטיסטית (SMT), תרגום מכונה עצבית (NMT) יכול להגיע לרמות אנושיות של שטף שפה במקרים טובים, אך הוא נכשל בהרבה שגיאות בתחומים אחרים.
שלא כמו מתרגם אנושי, המודלים העצביים של היום אינם מבינים למעשה את המשמעות העמוקה יותר של המושגים והרעיונות שהם קוראים, הם פשוט מכירים דפוסים קבועים מראש. מערכות NMT יכולות לזהות דפוסים מורכבים הרבה יותר, לבצע פעולות עריכה מתוחכמות הרבה יותר, והן פועלות על פני חלון טקסט גדול בהרבה, אך אפילו מערכות NMT עדיין פועלות בעיקר ברמה של משפט או גוש טקסט קטן בבידוד. אנחנו עדיין רחוקים מלהיות בעלי יכולת ייצור של מערכות NMT שיכולות לקרוא קטע שלם של טקסט, לזקק אותו לרעיונות המופשטים ולפרספקטיבות שבהם הוא דן, ואז להפוך אותו לשפה אחרת לגמרי.
חברות מאמינות כי פתרונות למידה מעמיקה יהיו טובים יותר מכל פתרון אחר, במקום להכיר בכך שלא כל בעיה מתאימה לגישות עצביות עכשוויות.
אף פעם לא ניסו
הרבה חברות בונות פתרונות של למידה מעמיקה עבור משימות בסיסיות, כמו זיהוי אזכור של אדם מסוים או של חברה. אך כאשר נשאל אם מודל הלמידה העמוקה היקר עולה באיכותו על חיפוש פשוט של מילות מפתח – התשובה שנקבל לעתים קרובות מדי, שהחברות למעשה אף פעם לא ניסו. הן פשוט הניחו שהמודל העצבי הוא הדרך בה מומלץ לבחור. ההשוואה הסופית, אם היא מבוצעת בכלל, מראה לעתים קרובות שהגישה העצבית היתה למעשה פחות מדויקת בכך שהיא היתה רגישה מדי לשגיאות כתיב ולטעויות דקדוקיות בטקסט.
זיהוי ישויות עצביות, סיווג, קידוד גיאוגרפי וניתוח רגשות הם כל התחומים שבהם אפילו האלגוריתמים החדישים ביותר נאבקים לעתים קרובות בביצועיהם על פני האלגוריתמים שנכתבו בגישות קלאסיות. הנחת היסוד היא שאלגוריתמים מסחריים מעטים נכתבו כמו שצריך.
רמות דיוק גבוהות בהבנת תמונות | צילום: shutterstock
עבודה עם פסיכולוגים ובלשנים
בפרט אלגוריתמי רגש מתבססים על אלגוריתמים פשוטים וקבועים שנבנו בעבר על ידי מתכנתים. אף אחד מהמפתחים לא צעד אחורה ועבד עם פסיכולוגים ובלשנים כדי להבין איך בני האדם מתקשרים כדי להבין את המורכבות והניואנסים של העולם האמיתי. בבחינת תוצרי למידת המכונה בחצי העשור האחרון התוצאות תמיד זהות: הגישות העצביות מציעות דיוק מאסיבי וקפיצת יכולת בכל הקשור לתוכן אור-קולי ובמשימות נבחרות של הבנה ויצירת תוכן, אך התפקוד שלהן בהבנה טקסטואלית שגרתית צריכה עוד להשתפר.
הבעיה היא שמומחי הלמידה המעמיקה הם מצרך נדיר ביותר. וגם מאגר הנתונים הכולל של המדענים, כזה שבאמצעותו הם יצעדו לאחור ויבנו מערכות חזקות שמשקפות את הנתונים וההקשרים – קטן עוד יותר. בקיצור, גישות עצביות מביאות תועלת רבה לחברות רבות לא בגלל השימוש בלמידה עמוקה, אלא בגלל שיטות העבודה הקלאסיות שלהם.
אולי האתגר הגדול ביותר כיום הוא הפער העצום בין העבודה החלוצית של קבוצות המחקר של AI, כמו DeepMind של אלפבית, שהוא כלי שיכול ללמוד לשחק במשחקי וידאו ולהראות ניצנים ראשונים של אינטואיציה מלאכותית, לבין למערכות הלמידה העמוקות שנבנו במגזר המסחרי.
היכולת לאפשר למכונות לחשוב על העולם, לתקשר ולהבין את העולם החיצון, ללמוד משימות חדשות במהירות – כל אלה הן יכולות מדהימות שגישות הלמידה העמוקות מתאימות להן באופן ייחודי. יחד עם זאת, הגישות הללו הם רחוקות ממה שקיים כרגע במגזר העסקי.
אם מתחשבים בכל הנתונים הללו, אין ספק שהמיתולוגיה סביב AI היום היא יותר התלהבות שיווקית מאשר שיקוף של המציאות. חברות ממהרות לפרוס AI בכל מקום כדי לטעון שהן חברות המשתמשות ב-AI, אך המודלים העצביים הם לא תמיד מדויקים יותר מאשר המערכות הקלאסיות שהם מחליפים. במקרים רבים הם למעשה גרועים אף יותר. גישות עצביות אכן שינו את ההבנה האור-קולית, אך כשמדובר בהבנה טקסטואלית, הגישות העצביות אינן מייצגות תמיד קפיצת מדרגה גדולה. הגישה הזאת עשויה להשתנות, כשיסתיים המחקר של יישומים חלוציים של למידה עמוקה במעבדות המחקר של מקומות כמו DeepMind, אבל חברות יעשו טוב אם יעצרו וישאלו אם הלמידה העמוקה היא באמת התשובה לכל בעיה נתונה.
|