בעת האחרונה נמנע סם אלטמן, האיש שמוביל את חברת הבינה המלאכותית OpenAI, מלהתראיין. לפני פחות משנה, הוציאה החברה גרסה משודרגת של מחולל התמונות Dall-E, המייצר תמונות מרהיבות על פי פקודות בשפה טבעית. ההתרגשות סביב השירות הייתה גדולה. חודשים ספורים לאחר מכן השיקה OpenAI את מחולל השפה ChatGPT. ככל הנראה נושא השיחה הלוהט ביותר כיום.
למרות המרחק שהוא שומר כרגע מהתקשורת, הצליח פורבס לתפוס את אלטמן, מנכ"ל החברה ומייסד משותף שלה, לראיון בלעדי ולשמוע ישירות מפיו על מהפכת ה־AI, התחרות מול גוגל, עמדתו בנוגע לקפיטליזם וגם מה צפוי הלאה, בהמשך הדרך. להצטלם עבור פורבס, לעומת זאת – הוא סירב. אז נאלצנו להסתפק במה שיש ל־Dall-E להציע.
האם הופתעת מהתגובות ל־ChatGPT?
"תמכתי ברעיון הזה כי האמנתי שהוא יעבוד. אפשר לומר שהופתעתי במידת מה מעוצמת ההתלהבות, אבל האמת היא שציפיתי שאנשים באמת יאהבו את זה".
גרג ברוקמן, נשיא OpenAI, אמר לנו שהצוות כלל לא היה בטוח ששווה להשיק את השירות. אז כנראה שלא כולם הרגישו כמוך.
"זו לא פעם ראשונה שהצוות לא נלהב בנוגע להשקה. היו מקרים לא מעטים בעבר שאנחנו אמרנו: 'בואו ננסה ונראה מה קורה'. במקרה הספציפי הזה אני דחפתי חזק. הייתי בטוח שזה יעבוד".
בינה מרובה
ChatGPT הוא צ'אטבוט המבוסס על מודל השפה האוטורגרסיבי GPT־3, המשתמש בלמידה עמוקה כדי לייצר משוב אנושי לכאורה לשאלות או לסיפורים שמוצגים בפניו. הוא יכול להגיב באופן רלוונטי לנאמר, להודות בטעות, לדחות בקשות בלתי הולמות, ליצור שפה דמיונית, לכתוב מאמר או תסריט, לאתר באגים בקוד, לפתור בעיות מתמטיות מורכבות, למצוא אי דיוקים ועוד. כל זאת במסווה של שיחה אנושית וטבעית – רק עם מכונה. התגובות של ChatGPT נשמעות אנושיות מכיוון שהוא הוכשר על ידי כמויות אדירות של נתונים שנכתבו על ידי בני אדם.
כל זה נשמע מלהיב למדי והפוטנציאל הוא עצום, אבל יש גם נקודות תורפה משמעותיות. הצ'אטבוט שואב את המידע מהמקורות שהוזנו לתוכו (במקרה זה עד לסוף שנת 2021). הוא לא יכול לחפש מידע באופן פעיל ולכן המידע שהוא שולף אינו עדכני ועלול להיות שגוי. בעיה נוספת היא שכש־ChatGPT טועה, הוא טועה בביטחון גמור. כלומר, המידע שהוא מוסר נשמע, נראה ומתנהג נכון, גם אם הוא שגוי מיסודו. כמו כן, הוא גם עלול לפספס ניואנסים אנושיים בשיחה.
אלטמן עצמו הודה בעבר במהמורות הללו כשצייץ בטוויטר: "ChatGPT מוגבל להפליא, אך טוב דיו בכמה דברים כדי ליצור רושם מטעה של גדלות. לסמוך עליו בכל דבר חשוב תהיה טעות". בעיה מרכזית נוספת היא שהוא עלול לספק גם מידע שהוא מוטה או גזעני, ויותר מכך: אנשים עלולים להשתמש בו במכוון כדי לייצר פייק ניוז או טקסטים פוגעניים.
על אף שהתחילה את דרכה כמעבדת מחקר ללא כוונת רווח, השקעה של מיליארד דולר הפכה את OpenAI ב־2019 לארגון עם מטרות רווח מוגבלות. המשקיעה מיקרוסופט הפכה לספקית הענן הבלעדית של מעבדת ה־AI והשיגה רישיון בלעדי לשימוש ולמסחר בטכנולוגיית GPT־3 של החברה. בתחילת השנה הכריזה ענקית הטכנולוגיה כי היא מתכננת לשלב את טכנולוגיית הבינה המלאכותית של OpenAI במוצרים שונים כמו Microsoft Word ו־Outlook. כמו כן, היא תשיק גרסה חדשה של מנוע החיפוש Bing, אליה יתווסף מודל שפה משודרג של OpenAI.
עם כל ההתרגשות סביב השותפות עם מיקרוסופט והמעבר למודל רווח, נדמה שאנחנו בנקודת מפנה בכל הנוגע לפופולריות של ה־ChatGPT. מנקודת מבטך, איפה נמצאת OpenAI במסע שלה?
"אין ספק שזו תקופה מרגשת. אבל אני מקווה שאנחנו עדיין ממש בתחילת הדרך. זה יהיה מסע מתמשך ואקספוננציאלי לשיפור הטכנולוגיה הזו ולקידום ההשפעה החיובית שלה על החברה. אפשר היה להגיד את אותו הדבר גם בזמן השקת ה־GPT־3 או ה־DALL-E. אפשר להגיד את זה עכשיו, ואני מאמין שנוכל להגיד זאת גם בהמשך הדרך. בשלב הזה אנחנו יכולים לטעות, או להיתקל במכשול שלא צפינו. אבל אני מאמין שיש סיכוי שבאמת עלינו על משהו משמעותי, שאפשר להגיע איתו רחוק מאוד".
אמרת בעבר שאתה חושב שאנשים עשויים להיות מופתעים מהאופן שבו ה־ChatGPT באמת פועל. למה התכוונת?
"ביסודה זאת לא טכנולוגיה חדשה שזוכה עכשיו לרגעי התהילה שלה. מודל הבסיס של ה־ChatGPT קיים בממשק API כבר הרבה זמן, עשרה חודשים או יותר. ChatGPT הוא עדכון של מודל GPT־3, אשר הושק לראשונה כ־API בשנת 2020. אחד הדברים המפתיעים זה הכיוונונים הקטנים שמאפשרים למודל להיות שימושי באופן מסוים. פענוח הפרדיגמה הנכונה של יחסי אדם־מחשב מאפשר את זה. ואני חושב שזה משהו שאנשים לא מבינים. הרבה אנשים עדיין לא מאמינים לנו וחושבים שזה GPT־4".
האם התנופה שצובר תחום הבינה המלאכותית עוזרת לכם לעלות על הגל? או שזה דווקא הופך את העבודה שלכם למורכבת יותר?
"שני הדברים נכונים. ללא ספק".
אתה מאמין שמתעצבת פה מערכת גומלין אמיתית, שבה חברות אחרות, מלבד OpenAI, משיגות התקדמות משמעותית?
"בהחלט. אני חושב שזה הרבה יותר גדול מחברה אחת. למעשה, אני ממש מקווה שיש פה אקוסיסטם אמיתי. אני חושב שזה יהיה הרבה יותר טוב. כדאי שיהיו בינות מלאכותיות כלליות מרובות בעולם בשלב מסוים. זה מבורך".
עיניים קדימה
כשהוא נשאל על נקודות מכריעות אחרות בהיסטוריה הטכנולוגית, כמו הפריצה של מנועי החיפוש או מחשוב הענן, אלטמן מעדיף שלא לנסות להשוות. "תמיד יש מקבילות", הוא אומר. "ומצד שני, תמיד יש גם דברים שהם אידיוסינקרטיים. הטעות שרוב האנשים עושים היא לדבר יותר מדי על קווי הדמיון, במקום על הניואנסים העדינים". בכל זאת הוא מצהיר בזהירות כי הוא מאמין "שהגיוון בין גרסאות ה־AI השונות ומה שהן יציעו יהיה רחב יותר".
אנשים רבים תוהים האם ה־ChatGPT יחליף את מנוע החיפוש המסורתי, כמו גוגל. האם זה מעורר בך מוטיבציה או מרגש אותך?
"אני לא חושב שה־ChatGPT יחליף את מנוע החיפוש. אבל אני חושב שיום אחד, מערכת בינה מלאכותית תוכל לעשות זאת. יותר מכך: אני חושב שאנשים לגמרי מחמיצים את ההזדמנות כשהם מפוקסים על החדשות של אתמול. אני הרבה יותר מתעניין במה שיבוא, הרבה מעבר לחיפוש. אני לא ממש זוכר מה עשינו לפני החיפוש ברשת, אני כנראה צעיר מדי".
אנחנו החזקנו בבית CD-ROM של אנציקלופדיית בריטניקה כשאני הייתי ילד.
"כן, אוקיי. בדיוק. אף אחד לא אמר 'היי, אני אייצר גרסה משופרת של אנציקלופדיית בריטניקה על ה־CD-ROM'. הם אמרו: 'רגע, אפשר לעשות בדיוק את אותו הדבר בדרך אחרת לחלוטין'. מה שמרגש אותי בנוגע למודלים האלה זה שזה לא כמו לשאול 'איך אפשר להחליף את החוויה של להיכנס לרשת ולהקליד במנוע חיפוש', אלא 'מה נעשה שהוא שונה בתכלית והרבה יותר מגניב?'".
אנחנו מתקרבים להשגת משהו שדומה ל־AGI, בינה מלאכותית כללית?
"אני לא חושב שאנחנו סופר קרובים ל־AGI. אבל השאלה איך נדע שייצרנו את זה, זה משהו שאני מהרהר בו רבות לאחרונה. מה שאני יודע היום, לאחר חמש שנים או כמה שזה לא יהיה שאני עוסק בתחום – זה שזה לא יהיה כזה רגע ברור ומובהק. יהיה פה מעבר הרבה יותר הדרגתי. ואני גם לא מאמין שתהיה הסכמה על הרגע המדויק שבו הייתה לנו בינה מלאכותית כללית".
איך אתה מנווט בין הצורך להשיג רווח למשקיעים לבין אתוס הפתיחות של OpenAI?
"אני חושב שהקפיטליזם הוא מעולה. אני אוהב קפיטליזם. מכל המערכות הגרועות שיש בעולם, זו הטובה ביותר, או הכי פחות גרועה, שמצאנו עד כה. אני מקווה שנמצא בהמשך דרך טובה יותר. אם הבינה המלאכותית הכללית באמת תתרחש, אני יכול לדמיין כל מיני דרכים שונות שבהן היא תשבור את הקפיטליזם.
"ניסינו ליצור מבנה שהוא, ככל הידוע לי, שונה מכל מבנה תאגידי אחר שקיים, כיוון שאנחנו באמת מאמינים במה שאנחנו עושים. אם היינו חושבים שזו הולכת להיות סתם עוד חברה טכנולוגית, הייתי אומר 'אחלה, אני מכיר את המשחק הזה, אני משחק בו כל הקריירה שלי, אז בואו נקים חברה ממש גדולה'. אבל אם באמת תהיה בינה מלאכותית כללית שתפרוץ, נזדקק למשהו שונה (מבחינת מבנה חברה). אני מאוד נרגש מכך שהצוות שלנו והמשקיעים מצליחים כל כך. אבל אני לא חושב שנכון שחברה אחת תשלוט בכל תחום ה־AI ותהיה היחידה להרוויח ממנו".
פתיחות הכרחית
אלטמן מצהיר כי עם התקדמות החברה וככל שתצליח להפוך את כליה בטוחים יותר, כך תמשיך ותספק ממשקי API חזקים יותר ותשחרר לקהל הרחב בקוד פתוח שירותים שונים בדיוק כמו שפתחו עד כה את CLIP, המודל שמדרג את התפוקה של DALL-E2, את מודל זיהוי הקול Whisper ואת מודל התכנות Triton. "זאת אסטרטגיה להוציא דברים אל העולם, תוך איזון סיכונים ורווחים של כל אלמנט בנפרד", הוא אומר.
"גוגל לא מציעה דברים כאלה לשימוש הקהל הרחב. מעבדות מחקר אחרות לא עושות זאת מסיבות אחרות. חלק מהאנשים חוששים שזה לא בטוח. אבל אני מאמין שזה הכרחי, כחברה, שאנשים יוכלו לחוש ולהתנסות בזה, לראות מה היתרונות ולהבין את החסרונות", הוא מסביר. "אני חושב שהדבר הכי חשוב שאנחנו עושים זה לשים את הדברים האלה שם בחוץ, כדי שהעולם יוכל להתחיל להבין מה מגיע".
זאת אומרת שאתה לא מרגיש שהעניין העסקי של OpenAI עלול להתנגש עם המשימה הרחבה שלקחתם על עצמכם?
"בכלל לא. תשאל את מי שאתה רוצה. אני ידוע בזה שאני לא מוכן להשלים עם דברים שאני לא מסכים איתם. לא הייתי חותם על העסקה אם הייתי חושב שזה יקרה. בחנו היטב וניסחנו היטב את הפרטים כדי לוודא שנוכל להגשים את המשימה שלנו. חוץ מזה, מנכ"ל מיקרוסופט סאטיה נאדלה וחברת מיקרוסופט הם אדירים. אני חושב שהם, ללא צל של ספק, החברה הטכנולוגית שהכי מיושרת עם הערכים שלנו".
מה הדבר הכי מגניב שראית מישהו עושה עם ה־ChatGPT עד כה?
"זה ממש קשה לבחור דבר אחד. זה די מדהים לראות את מגוון הדברים הרחב שאנשים עושים. אני יכול להעיד על הדברים שהכי עזרו לי. ליכולת התמצות הייתה השפעה עצומה מבחינתי, הרבה מעבר למה שציפיתי. העובדה שאני יכול פשוט לקבל סיכום של מאמר שלם או של שרשור ארוך באימייל, שימושית עבורי הרבה יותר משחשבתי. דבר נוסף זו היכולת לשאול שאלות תכנות אזוטריות כדי לפתור בעיה בקוד, ולהרגיש כאילו אני משוחח עם מתכנת מבריק".
ומה הדבר שהכי מפחיד אותך?
"הכי מפחיד? אני בהחלט מודאג מאוד מעניין יצירת פורנוגרפית הנקם (הפצת תמונות אינטימיות ללא הסכמה), שמתרחשת עם פתיחת מחוללי התמונות בקוד פתוח. אני חושב שזה גורם לנזק עצום וצפוי מראש".
אתה חושב שלחברות מאחורי הכלים האלה יש אחריות לדאוג שדברים כאלה לא יקרו? או שזה פשוט חלק בלתי נפרד מהטבע האנושי?
"אני חושב ששני הדברים נכונים. קיימת השאלה איפה דרושה רגולציה. במובן מסוים, זה יהיה מעולה אם אפשר יהיה פשוט לפנות אל החברות האלה ולהגיד 'היי, אתם לא יכולים לעשות את זה'. אבל אני מניח שאנשים ישחררו מודלים בקוד פתוח, ללא כל קשר, ובחלק מהמקרים זה יהיה נפלא, אבל יהיו גם דברים רעים שיקרו. חברות שפועלות על בסיס המודלים האלה, או חברות שיש להן קשר ישיר עם לקוח הקצה, גם להן תהיה אחריות מסוימת. לכן, אני חושב, שיש פה עניין של אחריות משולבת".