Forbes Israel Logo

עניין של דיוק: סטארט-אפ התרגום שקורא תיגר על גוגל ומיקרוסופט

ל-DeepL אין מודל שפה גדול, אבל ""בינה מלאכותית יוצרת היא הזדמנות ענקית" | צילום: Shutterstock
ל-DeepL אין מודל שפה גדול, אבל "בינה מלאכותית יוצרת היא הזדמנות ענקית" | צילום: Shutterstock
גם Google Translate וגם ChatGPT אומנם מסייעים בתרגום אוטומטי משפה לשפה, אך עדיין נדרש שכתוב אנושי של התוצאה • השירות של DeepL רותם את הבינה המלאכותית כדי לשפר את התרגום, ומשלב מנגנון למידת שפה הדומה לזה הקיים במוח האנושי

יארוסלב קוטילובסקי מדבר גרמנית, פולנית ואנגלית (והוא יכול להזמין קולה גם בצרפתית). עם DeepL, כלי התרגום שמופעל על ידי הסטארט-אפ שלו, הוא יכול לקרוא ולכתוב בכ-30 שפות נוספות.

DeepL, שנוסד ב-2017 ושמופיע לראשונה ברשימת 100 חברות הענן של פורבס, פיתח תוכנת תרגום הרבה יותר מדויקת ממוצרים מתחרים המוצעים על ידי גוגל ואחרות, הודות למנועי בינה מלאכותית עוצמתיים הפועלים בשיתוף פעולה עם אנשים שדוברים את השפה כשפת אם ומעניקים משוב לתוכנה.

הטכנולוגיה של החברה מבוססת על מה שמכונה ארכיטקטורת רשת עצבית, ומדובר בטכניקת למידת מכונה המסייעת למחשב ללמוד מידע באותו האופן שבו מוח אנושי עושה זאת. הטכנולוגיה הוכשרה במסד נתונים עצום של טקסט דו-לשוני (מתורגם) וחד-לשוני (לא מתורגם) ב-31 שפות שונות, כולל סינית, רוסית, ספרדית ואיטלקית.

זהו אומנם חלק זעיר מ-130 השפות שניתן לתרגם באמצעות גוגל. אבל התרגומים של DeepL עוברים כאמור 'כיול' על ידי עורכים אנושיים. הסטארט-אפ מעסיק 20 עורכים פנימיים ויותר מאלף מתרגמים אנושיים ברחבי העולם כדי להעריך את איכות התרגומים המיוצרים על ידי המודל של DeepL ולדייק אותם.

"אנחנו צריכים הרבה נתונים שתורגמו על ידי אדם באיכות גבוהה רק כדי ללמוד את המוזרויות של שפה כדי לתרגם טקסט סתמי וגם רשמי", אמר קוטילובסקי.

ניואנסים תרבותיים

DeepL מתגאה ביותר מ-10 מיליון משתמשים פעילים חודשיים, חצי מיליון מהם משלמים בין 9 ל-59 דולר לחודש. זה כולל סבים וסבתות שמשתמשים ב-DeepL כדי לדבר עם נכדים בשפת האם שלהם ובני זוג בקשר רומנטי שנאבקים עם מחסום השפה. אבל רוב העסקים של DeepL מגיעים מ-20 אלף הלקוחות הארגוניים שלה – מרצדס בנץ, פוג'יטסו וחברת הרכבות הגרמנית Deutsche Bahn, שמשתמשים בתוכנה של DeepL כדי לתרגם הכל: מאתרים, דרך חוזים משפטיים והסכמי לקוחות ועד למיילים ומצגות PowerPoint.

קוטילובסקי. "אנחנו צריכים הרבה נתונים שתורגמו על ידי אדם רק כדי ללמוד את המוזרויות של כל שפה" | צילום: DeepL
קוטילובסקי. "אנחנו צריכים הרבה נתונים שתורגמו על ידי אדם רק כדי ללמוד את המוזרויות של כל שפה" | צילום: DeepL

בינואר 2023, הסטארט-אפ הממוקם בקלן, שבגרמניה גייס מימון של כ-100 מיליון דולר מקרן הון סיכון גלובליות לפי שווי של מיליארד דולר, לפי Pitchbook. המנכ"ל והמייסד קוטילובסקי לא אישר את סך המימון שגייסה החברה שלו עד היום.

DeepL הורדה ב-25 מיליון מכשירים – סכום זעום בהשוואה ליותר ממיליארד התקנות של Google Translate. אבל מי שהשתמש בו מברך על הדיוק שלו. נינה גפני, מתרגמת מקצועית שבסיסה בוושינגטון הבירה, שעבדה בעבר עבור הבולשת הפדרלית כבלשנית ומתרגמת, משתמשת ב-DeepL כדי לתרגם צרפתית, גרמנית ואיטלקית לאנגלית. היא אומרת שבעוד שמערכות למידת מכונה לעולם אינן מושלמות לחלוטין בתרגומים שלהן, התרגומים של DeepL הם בעלי ניואנסים תרבותיים ומדויקים יותר מרובם.

"לפעמים תרגום מכונה יכול להיות מילולי מדי וזו בעיה גדולה", אמרה גפני. "לפעמים אני מרגישה שאני יכולה לסמוך הרבה יותר על DeepL מאשר על Google Translate".

שומרים על העיצוב

אקיקו טאגוצ'י, דוברת יפנית כשפת אם שעובדת עבור DeepL, אמרה לפורבס שהיא משקיעה את רוב זמנה לוודא שהתרגומים של DeepL נכונים מבחינה הקשרית ונשמעים אנושיים. "נתתי למכונה את המשוב שלי ומאז התרגום השתפר משמעותית".

DeepL, שנוצרה מתוך כלי תרגום של מנוע החיפוש Linguee, מאפשרת למשתמשים לתרגם מסמכים שלמים כמו וורד, פאוור פוינט ו-PDF תוך שמירה על העיצוב של המסמך. הוא מציע תרגומים חלופיים ומאפשר למשתמשים לבנות מילון מותאם אישית כדי לציין בפני התוכנה כיצד יש לתרגם מילים מסוימות.

נינה גפני, מתרגמת מקצועית מוושינגטון: "לפעמים תרגום מכונה יכול להיות מילולי מדי וזו בעיה גדולה. לעיתים אני מרגישה שאני יכולה לסמוך הרבה יותר על DeepL מאשר על Google Translate"

עם דוקטורט במדעי המחשב פיתח קוטילובסקי את טכנולוגיית למידת המכונה העומדת בבסיס DeepL ב-2016, במקביל לכך שחוקרים של גוגל עבדו על Transformers, פריצת הדרך הטכנולוגית מבוססת התרגום שמניעה את ChatGPT. אבל נכון לעכשיו, DeepL לא משתמשת ב- Transformers ולא במודלים של שפות גדולות לתרגום, הוא אמר, וסירב לציין על מה מבוססת הארכיטקטורה המדויקת של DeepL. "ידענו שרשתות עצביות עומדות לשלוט בתחום הזה בקרוב מאוד", אמר קוטילובסקי. "היינו משוכנעים שכל דבר ששימש לתרגום בעבר, כמו שיטות סטטיסטיות, לא יהיה יישומי בעתיד".

זה מתגלה כנכון, לפי קארת'יק ראמאקרישנן, שותף ב-IVP, שהוביל את סבב ההשקעה של 100 מיליון דולר בסבב B בינואר האחרון. השוק העולמי של שירותי התרגום מוערך ב-27.9 מיליארד דולר, אבל הוא לא נוצל היטב. "הרוב המכריע של התרגום הוא עדיין מאוד ידני, וזרימת העבודה מיושנת", אמר ראמאקרישנן. "אנשים שוכרים ספקי שירותי שפה במיקור חוץ שלוקח להם ימים או אפילו שבועות".

עם שבחים מצד הלקוחות והערכת השווי של מיליארד דולר, DeepL נמצאת בעמדה סבירה לנצל את השוק שראמאקרישנן צופה בו. אבל כך גם אחרים. למרות שכלי התרגום של גוגל אולי לא מדויק כמו DeepL, הוא תומך ב-130 שפות ומגובה על ידי ענק שהשקיע עשרות שנים בבינה מלאכותית. מתחרה טכנולוגית גדולה נוספת היא Microsoft Translator, שתומכת ביותר מ-100 שפות ודיאלקטים, ויש לה משתמשים ארגוניים גדולים כמו קבוצת פולקסווגן. בינתיים, ChatGPT – הבוט שככל הנראה הכניס את הבינה המלאכותית למיינסטרים – יכול לתרגם 50 שפות כרגע, אבל סובל מבעיות רבות. זה ישתפר רק הודות להמשך ההתפתחות של מודלי השפה הגדולים המובילים בתעשייה של חברת האם שלה – OpenAI.

ל-DeepL אין LLM (מודל שפה גדול) משלה – עדיין. קוטילובסקי אמר לפורבס שהוא מתכנן לבנות אחד ולשלב אותו עם מודל התרגום הקטן הנוכחי לקבלת תוצאות טובות יותר. לשם כך, DeepL בונה תשתיות חומרה חזקות מספיק לאימון מודלים של בינה מלאכותית באמצעות מרכז הנתונים של Nvidia בשוודיה. "בינה מלאכותית יוצרת היא הזדמנות ענקית", אמר. "זה יאפשר לנו לבנות פונקציות על גבי התרגום, שבהן המתרגם הופך אינטראקטיבי יותר או נמצא איתך בדיאלוג עשיר יותר".

הרשמה לניוזלטר

באותו נושא

הרשמה לניוזלטר

מעוניינים להישאר מעודכנים? הרשמו לרשימת הדיוור שלנו.