כריס מלקובסקי, אחד ממייסדי Nvidia, אוכל חביתה ונקניקייה ולוגם קפה שרוף בסניף של מזללת דני'ז בסן־חוזה. באותה ארוחת ערב צנועה ב־1993, שלושה מהנדסי חשמל צעירים – מלקובסקי, קרטיס פריאם ומנכ"ל Nvidia כיום ג'ן סון־הואנג – ייסדו חברת שבבים מיוחדים, שייצרו חוויה גרפית מהירה וריאליסטית יותר למשחקים.
האזור המזרחי של סן־חוזה היה החלק הקשוח של העיר – חזית המסעדה היתה מעוטרת בחורי כדורים שירו עבריינים על ניידת משטרה שחנתה במקום. איש לא היה יכול לנחש ששלושת הצעירים, שלגמו אינספור כוסות קפה, הניחו את היסודות לחברה שתגדיר מחדש את עולם המחשוב בתחילת המאה ה־21 באותו האופן שאינטל עשתה זאת בשנות ה־90.
"השוק לא היה קיים ב־1993, אך ראינו את הגל שבדרך", אומר מלקובסקי. "בקליפורניה יש תחרות גלישה שמתרחשת בחלון של חמישה חודשים בכל שנה. כשהם מזהים סערה ביפן, הם מודיעים לכל הגולשים להגיע לקליפורניה, מכיוון שעומדים להגיע גלים בעוד יומיים. כך בדיוק זה היה בהתחלה".
הגל שמייסדי Nvidia ראו היה השוק הטרי של GPU או "יחידות עיבוד גרפיות". השבבים האלו, שנמכרים בדרך כלל ככרטיסים שגיימרים מחברים ללוח האם במחשב שלהם, מאפשרים תצוגות גרפיות תלת־ממדיות מהירות באיכות גבוהה. הכרטיסים שווקו תחת שמות נוטפי טסטוסטרון, כמו Titan X או GeForce GTX 1080 ומחירם הגיע עד ל־1,200 דולר. שני עשורים לאחר מכן, הכרטיסים הגרפיים עדיין מייצרים יותר ממחצית הרווחים השנתיים של Nvidia (5 מיליארד דולר בשנה).
למרות השרידות המפתיעה של תחום המשחקים ל־PC (התחום צמח ב־63% בשנה האחרונה ב־Nvidia, בניגוד למגמה העולמית בשוק ה־PC), לא זו הסיבה שמשקיעים בוול סטריט מזילים ריר על החברה, אלא האינטליגנציה המלאכותית (AI). בצירוף מקרים מרתק תוצרת עמק הסיליקון, מתברר שאותה הטכנולוגיה שמציגה בפנינו חייזרים או פיצוצים באיכות חסרת תקדים, מתאימה לעולם החם בתחום ה־AI: הלמידה העמוקה (Deep Learning). למידה עמוקה מאפשרת למחשב ללמוד בעצמו, ללא עזרת מתכנתים שנדרשים לקודד ידנית, והדבר מוביל לרמות דיוק חסרות תקדים בתחומים, כמו זיהוי קול ותמונה.
ענקיות טכנולוגיה, כמו גוגל, מיקרוסופט, פייסבוק ואמזון, קונות כמויות הולכות וגוברות של שבבים מ־Nvidia למרכזי הנתונים שלהן. מוסדות כמו בית החולים הכללי של מסצ'וסטס משתמשים בשבבים כדי לזהות חריגות בדימות רפואיות כמו סריקות סי.טי. טסלה הכריזה לאחרונה שהיא תתקין את השבבים של Nvidia במכוניות האוטונומיות שלה, והשבבים של Nvidia מספקים גם את הכוח המניע של קסדות המציאות המדומה, כמו אלו של פייסבוק ו־HTC.
"באף שלב בהיסטוריה של החברה שלנו לא היינו במרכזם של שווקים גדולים כאלו", אומר הואנג במטה החברה בסנטה קלרה, קליפורניה. "אפשר לייחס זאת לעובדה שאנחנו עושים דבר אחד ממש טוב – מחשוב GPU".
החברה כאדם
כ־3,000 סטארט־אפים בתחום ה־AI פועלים בעולם, ורבים מהם משתמשים בפלטפורמה של Nvidia. הם משתמשים ב־GPU של Nvidia כדי להטמיע AI באפליקציות מסחר במניות, בקניות מקוונות ובניווט רחפנים. חברה בשם June אפילו משתמשת בשבבים של Nvidia בתנור בעל אינטליגנציה מלאכותית.
"השקענו בסטארט־אפים רבים שמטמיעים למידה עמוקה במגוון תחומים, וכולם משתמשים ביעילות בפלטפורמה של Nvidia", אומר מארק אנדרסן, מפירמת הון הסיכון אנדרסן הורוביץ. "הדבר מזכיר את התקופה שבה כולם הסתמכו על ווינדוס בשנות ה־90 או על האייפון בסוף שנות ה־2000. יש לנו משחק בחברה, שבו אנחנו מהמרים בשביל הכיף על אילו חברות ציבוריות היינו משקיעים, לו היינו קרן גידור. כולנו שמנו את הכסף שלנו על Nvidia".
הדומיננטיות של Nvidia בסקטור ה־GPU (נתח של יותר מ־70%) והתרחבותה לשווקים חדשים, הזניקו את המניה לשחקים. עלייה של 200% בשנה האחרונה ושל 500% בחמש השנים האחרונות. תקרת השוק של Nvidia, העומדת על 50 מיליארד דולר, מציבה את מכפיל הרווחים שלה על קרוב ל־40, אחד הגבוהים בתעשייה. הביצועים האלו הניבו 2.4 מיליארד דולר להואנג (מלקובסקי פרש למחצה, ופריאם עזב ב־2003).
מנכ"ל Nvidia כיום, ג'ן סון-הואנג. בגיל 30 חלם על הקמת חברת שבבים גרפיים | צילום: פליקר Nvidia
הזינוק במניות הוא אחת הסיבות ש־Nvidia נמצאת בראש תעשיית המוליכים למחצה בדירוג פורבס לתאגידים האמריקאיים הטובים ביותר. הדירוג סקר 50 אלף אמריקאים שדירגו 1,000 חברות ציבוריות על בסיס היחס שלהן לעובדים, ללקוחות ולבעלי המניות.
מתוך עשרת התחומים שנבדקו, Nvidia היתה הרבה מעל הממוצע בשכר ובהטבות לעובדים, תכונות מוצר והשפעה סביבתית. המדיניות הידידותית של החברה כלפי עובדים – חופשות נדיבות, שעות עבודה גמישות ותוכניות לניהול מתח – הביאו את Nvidia לדירוג גבוה מאוד ב־Glassdoor, אתר דירוג מקומות העבודה האנונימי הפופולרי בקרב עובדי עמק הסיליקון. בתעשייה הומוגנית ביותר, ל־Nvidia יש תוכניות רשמיות לשילוב מוגבר של נשים ומיעוטים במשרות ליבה בתחום ההנדסה.
"אני חושב על החברה כבן־אדם, כישות", אומר הואנג. "תרבות של חברה היא הקוד הגנטי או מערכת ההפעלה שלה. אם יש משהו שלמדתי על בניית חברות, זה שהתרבות היא הדבר החשוב ביותר".
הכל התחיל בסושי
הואנג תמיד ידע שלשבבים הגרפיים שלו יש פוטנציאל הרבה מעבר להנעת משחקי הווידאו החדישים ביותר, אך הוא לא צפה את המעבר ללמידה עמוקה. טכניקות של למידה עמוקה (או – רשתות נוירוניות) שואבות השראה מפעולתו של המוח האנושי באמצעות נוירונים וסינפסות. הדבר קיים בשדה האקדמי לפחות מאז שנות ה־60, כאשר ההתקדמויות המשמעותיות התרחשו בשנות ה־80 וה־90. אולם שני גורמים מנעו מהתחום להמריא: כמות הנתונים הדרושה לאימון אלגוריתמים, וגישה לכוח מחשוב טהור וזול.
האינטרנט פתר את הבעיה הראשונה – לפתע כמויות בלתי מוגבלות של נתונים הפכו זמינות לכולם בלחיצת כפתור. אך כוח המחשוב היה עדיין מחוץ להישג יד.
מ־2006 Nvidia שחררה ערכת כלי תכנות בשם CUDA, שאפשרה למקודדים לתכנת בקלות כל פיקסל על המסך. יחידת GPU דימתה אלפי מחשבים קטנים, הפועלים יחד כדי לעצב כל פיקסל. המחשבים האלו השתמשו בהרבה פעולות מתמטיות פשוטות כדי ליצור צללים, השתקפויות, תאורה ושקיפות. לפני ש־CUDA שוחררה, תכנות GPU היתה מטלה ארוכה וקשה עבור מתכנתים, שנדרשו לכתוב הרבה מאוד קודים מתמטיים ברמה נמוכה. CUDA, פרי פיתוח של שנים ב־Nvidia, הביאה את היכולת לתכנת בקלות שפות ברמה גבוהה, כמו ++Cּּּּ וג'אווה, ל־GPU. באמצעות CUDA, חוקרים יכלו לפתח את המודלים שלהם ללמידה עמוקה במהירות ובזול.
"למידה עמוקה דומה מאוד למוח", אומר הואנג. "היא יעילה ברמה לא הגיונית. אפשר ללמד אותה לעשות כמעט הכל. אך יש לה חיסרון ענק: היא זקוקה לכמות אדירה של מחשוב. והנה אנחנו, עם ה־GPU, מודל מחשוב כמעט אידיאלי ללמידה עמוקה".
רגע מכונן בדרך לאימוץ כולל של למידה עמוקה הגיע ב־2010 במסעדה יפנית בפאלו אלטו, קליפורניה. אנדרו נג, פרופסור מאוניברסיטת סטנפורד, היה במקום בפגישה עם מנכ"ל גוגל (היום, אלפבית) לארי פייג' וסבסטיאן ת'רון, מדען המחשבים הגאון שעמד אז בראש פרויקט "גוגל X". שנתיים קודם לכן, נג פרסם את אחד מהמאמרים הראשונים על יעילות שילוב GPU במודלים של למידה עמוקה. "למידה עמוקה היתה מאוד לא פופולרית ב־2008", הוא אומר. "היה הרבה יותר סקסי לחשוב על טריקים באלגוריתמים".
ת'רון, שפיתח כמה מכלי הרכב האוטונומיים המעשיים הראשונים, אייש את המשרד השכן לזה של נג בסטנפורד, ושני המדענים הציעו לפייג' את הרעיון ליצור קבוצת מחקר ללמידה עמוקה בגוגל. זה היה הגיוני: תשתית המחשוב המאסיבית של גוגל היתה מושלמת לבניית הרשת הנוירונית הגדולה בעולם. פייג' הסכים, וכך נולד Google Brain. הלמידה העמוקה שנעשית בו נוכחת בכמעט כל מוצר של גוגל, בייחוד בזיהוי חיפוש, דיבור ותמונה.
בעוד שגוגל השיקה את Google Brain, חוקר אחר, במרחק 2,500 מייל משם, התעסק גם הוא עם למידה עמוקה. ב־2012 אלכס קריז'בסקי, אז דוקטורנט באוניברסיטת טורונטו, הגיש מחקר מדהים לתחרות ImageNet, שבה צוותים מכל רחבי העולם מתחרים על רמת הדיוק שבה התוכנה שכתבו יכולה לזהות עצמים ותמונות. מחדר השינה שלו, קריז'בסקי חיבר 1.2 מיליון תמונות לרשת נוירונית של למידה עמוקה, שהונעו באמצעות שני כרטיסי GeForce של Nvidia. המודל שלו הצליח להגיע לרמת דיוק חסרת תקדים, עם שיעור טעות של 15% – זינוק עצום משיעור של בערך 25% בעבר. קריז'בסקי לא רק זכה בקלות בתחרות, תוצאותיו הפכו ללהיט בחוגי האקדמיה. כיום הוא ושותפו עובדים בגוגל.
עם תוצאות כאלה, הלמידה העמוקה החלה להתפשט כאש בשדה קוצים. נוסף לגוגל, מחקרים ארוכי טווח בלמידה עמוקה החלו לצוץ במיקרוסופט, בפייסבוק ובאמזון. ההחלטה של Nvidia להשקיע משמעותית בסביבת התוכנה דרך CUDA היתה נקודת מפתח. "זו היתה השקעה משמעותית להרבה שנים", אומר איאן באק, שהוביל את פיתוח ה־CUDA ב־Nvidia. "כיום אנחנו קוצרים בוודאות את פירות החזון ארוך הטווח הזה".
Nvidia התאימה יותר ויותר את החומרה שלה ללמידה עמוקה. היא לקחה את שבב השרתים העדכני ביותר שלה, Tesla P100, ושתלה שמונה כמוהו במארז אחד, שאותו היא מכנה "מחשב העל AI הראשון בקופסה". המכונה, בשווי 130 אלף דולר, מספקת ביצועים של TeraFlop 170 – נתון המקביל לעבודה של 250 שרתים. באוגוסט, הואנג העביר באופן אישי את היחידה הראשונה לאלון מאסק ול־OpenAI, ארגון ה־AI ללא מטרות רווח שהוא מנהל.
מטה חברת Nvidia | צילום: פליקר Nvidia
פעם שלישית גלידה
הרוח התחרותית של הואנג היתה שם כבר מגיל צעיר. הוא נולד בטיוואן ב־1963 ומצא את עצמו במוסד לנוער בעייתי בגיל 10, בזמן שהוריו היו בהליך הגירה לארה"ב. היה זה מקום קשה. שותפו לחדר היה בן 17 והחלים מקטטה שבה נפצע מדקירות סכין. הואנג מצא מפלט באובססיה לטניס שולחן ובגיל 15 הוא דורג שלישי בזוגות באליפות ארה"ב הפתוחה.
הואנג גם התאהב במחשבים. הוא למד מדעי המחשב ועיצוב שבבים באוניברסיטת אורגון סטייט. שם הוא פגש את מי שתהיה אשתו, לורי. לאחר סיום הלימודים הם עברו לעמק הסיליקון, שם הואנג החל בעבודתו הראשונה בעיצוב שבבים ב־AMD, יריבתה של אינטל. הוא המשיך בלימודים וסיים תואר שני בהנדסת חשמל באוניברסיטת סטנפורד ב־1992. בזמן שעבד ב־LSI, מקום עבודתו השני, הוא פגש את מלקובסקי ופריאם, שניהם עובדי Sun Microsystem.
הואנג חגג 30 באותו הזמן, ושלושתם החלו לפנטז על הקמת חברת שבבים גרפיים. הם ראו הזדמנות אדירה להתקדמות בתחום הגרפיקה ל־PC, שהיה בסיסי ביותר בזמנו. השבב הראשון של Nvidia הוצג ב־1995, ופיתוחו עלה 10 מיליון דולר. המימון הגיע מהקרנות סקויה ו־Sutter Hill. לרוע המזל, השבב ניסה לעשות יותר מדי דברים ונכשל במשיכת לקוחות רבים. Nvidia, אז בת שנתיים, היתה על סף פשיטת רגל ונאלצה לפטר מחצית מעובדיה. אך השבב השלישי שלה, RIVA 128, שהוצג ב־1997, היה הצלחה פורצת דרך. הוא היה מהיר ב־400% בהשוואה לכל מעבד גרפי אחר, והישרדותה של החברה הובטחה. מבין 70 חברות בתחום שהיו קיימות בשנות ה־90, רק Nvidia ו־AMD שרדו.
הואנג הצליח ליצור כוח עבודה מרוצה מאוד. הוא מייחס חלק גדול משביעות הרצון של העובדים לסוג העבודה ש־Nvidia עוסקת בה. המעבר לתחום הלמידה העמוקה עורר מחדש את העובדים. "חייב להיות קשר בין העבודה שאתה עושה לבין טובתה של החברה שבה אתה חי", אומר הואנג. "העבודה שאנו עושים תיטיב עם החברה האנושית ברמה של מדע בדיוני כמעט. אנחנו רוצים לקדם את מציאת התרופה לסרטן. זה נשמע מדהים".
סוד גלוי
ההצלחה של Nvidia לא נשמרה בסתר. כל כוח משמעותי בעולם השבבים רודף לפתע אחר חלום ה־AI. שורה של סטארט־אפים עם סוגים שונים של ארכיטקטורת שבבים ללמידה עמוקה צצים במהירות. אך שחקני השבבים הם לא היחידים שמתרגשים. למידה עמוקה היא כל כך חיונית לעולם ההייטק העתידי, עד שאחת מלקוחותיה החשובים של Nvidia – שמעולם לא ייצרה שבבים משלה – היא המתחרה העיקרית: גוגל.
בכנס המפתחים השנתי שלה במאי, גוגל הכריזה שהיא בנתה שבב הנקרא Tensor Processor Unit, שהותאם במיוחד ל־TensorFlow, פלטפורמת הלמידה העמוקה שלה. גוגל מסרה שהיא ציידה את מרכזי הנתונים עם השבבים האלו כדי לשפר את המפות ואת תוצאת החיפוש שלה.
באופן דומה, לקוחה נוספת של Nvidia, מיקרוסופט, מייצרת שבבים משלה למרכזי הנתונים שלה.
אינטל, הגוף הבכיר בתחום המוליכים למחצה, מודאגת במיוחד מהתקדמותה של Nvidia. לאחר שאיחרה את הרכבת של בהלת הסמארטפונים, היא נואשת לא להחמיץ את הגל הבא של הלמידה העמוקה. ללא מחקר חדשני בתחום ה־AI מבית, אינטל פצחה במסע רכישות של מאות מיליוני דולרים כדי להישאר בחוד החנית.
אינטל מגוננת מאוד על הפרה החולבת שלה: מרכז הנתונים, שם היא למעשה מונופול עם נתח שוק של 99%. השבבים הנוכחיים של Nvidia לא יכולים להחליף את אלו של אינטל – הם פשוט עוקפים אותם. אך באינטל מעדיפים שלקוחות ישתמשו בחומרה שלה באופן בלעדי. ב־2017 אינטל מתכננת להשיק שבב שרתים מותאם ללמידה עמוקה, Xeon Phi. ועם הטכנולוגיה שהגיעה מ־Nervana (שאותה רכשה באוגוסט תמורת כ־400 מיליון דולר), אינטל טוענת בביטחון שהיא תאיץ את הלמידה העמוקה פי 100 עד 2020.
יתרונה של Nvidia נמצא בניסיונה הרב בתחום לעומת אינטל, AMD ויריבות אחרות. אך היא לא יכולה לנוח על זרי הדפנה. במשך שנים רבות היא היתה לבד בתחום. עתה השוק מוצף. "אני חושב ש־Nvidia נמצאת במקום טוב, ושהסיכויים לטובתה, אך לא הייתי מהמר עליהם כל כך מהר", אומר אנליסט ההייטק הוותיק ג'ון פדי. "יש יותר מדי אנשים שמסתכלים על התחום".
"AI הוא העתיד בעולם המחשוב", אומר הואנג. "כל עוד הפלטפורמה שלנו היא הטובה ביותר עבור AI, אני חושב שיהיה לנו סיכוי טוב לזכות בהרבה לקוחות. יחידות GPU יהיו בכל מקום".
עדיין, הואנג ירש חלק מסוים מהפילוסופיה של אנדי גרוב, הבוס לשעבר של אינטל, ומספרו: "רק הפראנואידים שורדים". "אני תמיד חושב שאנחנו נמצאים 30 יום מסגירת החברה", אומר הואנג. "זה אף פעם לא משתנה. זה לא עקב פחד מכישלון. זה הפחד מלהרגיש נינוח, ואני לא רוצה שההרגשה הזו תתקבע".
|
|