צילום: deepseek
צילום: deepseek

טראמפ: "DeepSeek הסינית – קריאת השכמה לעמק הסיליקון"

DeepSeek טוענת שמודל הבינה המלאכותית החדש שלה טוב כמו אלו של המתחרים האמריקאים, עלה פחות לבנייה והוא זמין בחינם. מה המשמעות של כל זה לעליונות האמריקאית בתחום הבינה המלאכותית?

סאטרט אפ הבינה המלאכותית הסיני DeepSeek טלטל את השווקים לאחר השקת מודל שפה חדש, שלטענתו מתפקד טוב כמו המערכות המתקדמות ביותר של OpenAI. הטכנולוגיה החדשה לכאורה מעוררת חששות לגבי יכולותיה של סין במרוץ הבינה המלאכותית הבינלאומי המתעצם ודוחף סטארט-אפים אמריקאים לבחון מחדש את עבודתם לאור העובדה שיריב זר הצליח – לטענתו – לעשות הרבה יותר עם פחות משאבים.

המעבדה הסינית הקטנה, שממוקמת בהאנגג'ו, שחררה בסוף דצמבר את V3, מודל שפה עם 671 מיליארד פרמטרים, שלפי הדיווחים אומן במשך חודשיים בלבד, בעלות של 5.58 מיליון דולר. זו עלות נמוכה בסדרי גודל מזו של ה-Chat GDP של OpenAI, מודל גדול יותר, עם כ-1.8 טריליון פרמטרים, שנבנה בעלות של 100 מיליון דולר. בשבוע שעבר השיק הסטארט-אפ הסיני פה מודל חדש, המתחרה לדבריו במודל o1 של OpenAI במה שמכונה "משימות חשיבה", כמו קידוד ופתרון בעיות מורכבות במתמטיקה ומדע. ובעוד OpenAI גובה מהמשתמשים 200 דולר בחודש עבור מודלים כאלה DeepSeek – מציעה את שלה בחינם.

העוצמה של המודל של DeepSeek והתמחור שלו כבר משנים את האופן שבו סטארט-אפים אמריקאים מנהלים את עסקיהם, וייאלץ ענקיות בינה מלאכותית אמריקאיות כמו OpenAI או  Anthropic  להעריך מחדש את המחירים שלהן.

אייסו קאנט, מנהל הטכנולוגיות הראשי ומייסד-שותף שלPoolside AI, יוניקורן שבונה בינה מלאכותית להנדסת תוכנה, אומר כי החוזקה של DeepSeek היא ביכולת ההנדסית שלה לעשות יותר עם פחות.

"החברה מראה לעולם שכאשר שמים דגש חזק על יעילות המחשוב באימון, אפשר לעשות הרבה", הוא אמר. "יש דברים מדהימים שאפשר להמשיך לסחוט מהשבבים של אנבידיה, כדי להפוך אותם ליעילים הרבה יותר."

אלכסנדר וואנג, המנכ"ל המיליארדר של ענקית נתוני האימוןScale AI , אמר שהמודל "מרעיד עולמות", ואילו ארווינד סריניוואס, מנכ"ל סטארט-אפ החיפוש בבינה מלאכותית Perplexity , כבר שילב את המודל במוצר החיפוש המרכזי.

זרוע תעמולה?

אחרים פחות מתרשמים. מיי חביב, מנכ"לית Writer, אמרה ל-Forbes שהיא לא מופתעת שהמודלים של DeepSeek, שאומנו בתקציב נמוך משמעותית, מצליחים להתחרות במודלים החכמים ביותר בארה"ב. באוקטובר השיקה Writer מודל שאומן בעלות של 700 אלף דולר בלבד, כאשר לפי הדיווחים OpenAI השקיעה כ-100 מיליון דולר בבניית GPT-4, מודל עם יכולות דומות. Writer השתמשה בנתונים סינתטיים כדי להוזיל את עלויות האימון.

במהלך סוף השבוע האחרון, כשהבאזז סביב החברה גדל, DeepSeek עקפה את ChatGPT בחנות האפליקציות של אפל, ודורגה במקום הראשון בהורדות אפליקציות חינמיות בארצות הברית. ואז, ביום שני, צנחו מניות טכנולוגיה בארה"ב, כשהפאניקה סביב ההשקה המוצלחת של המודל של DeepSeek התפשטה. באותה היום צנח שווי השוק של ענקית שבבי הבינה המלאכותית אנבידיה בכמעט 600 מיליארד דולר.

"זהו רגע הספוטניק של ה-AI", כתב המשקיע המיליארדר מארק אנדרסון, בהתייחסו להלם שאחז במערב כשבשנת 1957 הצליחו הסובייטים להיות הראשונים ששיגרו לוויין לחלל.

נשיא ארה"ב דונלד טראמפ אמר כי שחרור המודל החדש על ידי החברה הסינית צריכה להיות "קריאת השכמה לתעשיות שלנו. אנחנו צריכים להתמקד בתחרות כדי לנצח".

ממשל טראמפ הכריז לאחרונה על השקעות עתק בתחום הבינה המלאכותית – פרויקט סטארגייט, מיזם משותף של אורקל, OpenAI וסופטבנק היפני, הכולל השקעה של 500 מיליארד דולר בתשתיות הבינה המאלכותית. אולם השקת המודל החדש מגבירה את החשש שארה"ב עלולה לאבד את היתרון שלה בתחום, בעיקר כי הסינים הצליחו כל כך למרות מגבלות הייצוא הנוקשות של ארה"ב שמונעות ממנה להשתמש בשבבי הבינה המלאכותית המתקדמים ביותר של אנבידיה.

לצד ההתלהבות, ישנם גם כמה סימני שאלה סביב ההישג שלDeepSeek . חוקרים מצאו כי המודל החדש נוטה לצנזר את עצמו בנושאים שרגישים למפלגה הקומוניסטית הסינית. המודלים של DeepSeek לא מגיבים לשאלות על נשיא סין שי ג'ינפינג ומחאות כיכר טיאננמן ב-1989. מעבר לכך, קיימות חששות לפרטיות – נתונים שמוזנים למודלים של DeepSeek מאוחסנים בשרתים של החברה הממוקמים בסין.

דיוויאנש קאושיק, סגן נשיא בחברת הייעוץ לביטחון לאומי Beacon Global Strategies מזהיר מפני שימוש במודלים החדשים לא בדיקה יסודית. "יש להתייחס אליהם כזרועות תעמולה של המפלגה הקומוניסטית הסינית", אמר.

הרשמה לניוזלטר

באותו נושא

הרשמה לניוזלטר

מעוניינים להישאר מעודכנים? הרשמו לרשימת הדיוור שלנו.

דילוג לתוכן