top of page
תמונת הסופר/תDror Gill

גוגל ו-OpenAI ראש בראש: מי בראש?



גוגל ו-OpenAI הכריזו השבוע על יכולות חדשות ומוצרים חדשים בתחום הבינה המלאכותית. גוגל עשו זאת במסגרת כנס המפתחים השנתי שלהם Google I/O, ו-OpenAI הקדימו אותם ביום אחד עם ״עדכון האביב״. עכשיו אחרי שהאבק שקע, בואו נראה איפה נמצאים שני ענקי הבינה האלה במרוץ המטורף של ה-AI.


הפוסט הזה מחולק לפי קטגוריות שונות של מוצרים: צ׳אטבוטים חינמיים, אפליקציות למחשב, שילוב בפלטפורמות קיימות, עוזרים אישיים וכ״ו. חשוב לשים לב שחלק מהיכולות שהודגמו באירועים האלה זמינות עכשיו, חלק ישוחררו באופן הדרגתי בחודשים הקרובים, והשאר נמצאים עדיין בשלב המחקר.


צ׳אטבוטים חינמיים

לדעתי, ההכרזה הכי חשובה של OpenAI היא שמודל השפה המתקדם ביותר שלהם GPT-4o יהיה זמין מעכשיו בחינם לכל משתמשי ChatGPT. הגירסה החינמית הקודמת של ChatGPT הייתה מבוססת על GPT-3.5, מודל שפה הרבה יותר חלש ולא מעודכן. אז מעכשיו גם משתמשי החינם של ChatGPT יהנו מ-GPT-4o, וגם מכל הכלים המתקדמים שהיו זמינים קודם רק למשתמשים בתשלום: תמיכה בקבצים, כלי ה-Code Interpreter (שמריץ קוד פייתון כדי לבצע עיבוד על קבצים וניתוח של אקסלים), וגם הצ׳אטבוטים המותאמים אישית (Custom GPTs).


גוגל הכריזו השבוע שמודל השפה המתקדם שלהם Gemini 1.5 Pro (עם חלון קונטקסט עצום של מיליון טוקנים, או 1,500 דפים) יכנס לצ׳אטבוט בתשלום Gemini Advanced, אבל הגירסה החינמית של ג׳מיני עדיין מבוססת על המודל הקודם Gemini 1.0 Pro, ולא תומכת בקבצים. אז בקטגוריה הזו, OpenAI מנצחים בגדול.


אפליקציה למחשב

חברת OpenAI הכריזה על אפליקציה של ChatGPT למחשב, שיצאה השבוע בגרסת מק למשתמשים בתשלום. האפליקציה תומכת במצב השיחה הקולית שקיים באפליקציה לטלפון, ולא נתמך בגירסת הדפדפן. בשיחה הקולית עם יש עדיין השהיה ארוכה יחסית של 2-3 שניות לקבלת תשובה, אבל OpenAI הדגימו השבוע טכנולוגיה חדשה עם השהיה נמוכה שמאפשרת שיחה טבעית באפליקציה לטלפון. הטכנולוגיה הזאת תיכנס גם לאפליקציה במחשב, ובהמשך גם אפשרות להשתמש בהקלטות מסך. מה זה אומר? שבזמן שאתם עובדים על המחשב, תוכלו לדבר עם ChatGPT על תוכנה, מסמכים ואתרים שמוצגים אצלכם על המסך בזמן אמת. זאת מהפכה אמיתית!


לג׳מיני יש אפליקציה לנייד רק במערכת הפעלה של אנדרואיד, והם לא דיברו בהכרזה שלהם על אפליקציה במחשב. אז גם בנושא האפליקציה במחשב - OpenAI מובילה על גוגל. אבל - ג׳מיני משולב כבר בתוך הכרום: פשוט תכתבו gemini@ בשורת החיפוש ואח״כ את הפרומפט שלכם, וזה יפעיל את ג׳מיני עם הפרומפט.


שילוב בפלטפורמות קיימות

גוגל הכריזה השבוע שג׳מיני ישולב בחיפוש, באנדרואיד, ביוטיוב וב-Google Photos. בחיפוש, תכונה חדשה שנקראית AI Overviews תציג סיכום AI של מידע מאתרים בתגובה לשאילתת חיפוש, כשהמשתמשים יוכלו לקבוע את האורך והסגנון של הסיכום. השילוב עם אנדרואיד יאפשר לג׳מיני לצפות במסך הטלפון שלכם, כך שתוכלו להתייחס למה שמופיע שם בפרומפטים שלכם. ג׳מיני גם יקשיב לשיחות שלכם, ויזהיר אתכם אם הוא מזהה הונאות או שיחות ספאם. ובזמן שאתם צופים בסרטוני ווידאו ביוטיוב שמלמדים אתכם משהו, תוכלו לשאול את ג׳מיני שאלות על החומר, לקבל הסברים, ואפילו לענות על חידונים בנושא. ב-Google Photos גוגל מוסיפים תכונה חדשה שנקראית Ask Photos, באמצעותה תוכלו לשאול שאלות על התמונות שלכם, כמו למשל: ״תראה לי את התמונה הכי טובה מכל שמורת טבע שביקרתי בה אי פעם״, או ״באיזה נושאים כבר עשינו יום הולדת לליאת?״.


רק חברה שיש לה פלטפורמות יכולה לשלב את היכולות האלה ישירות לתוכן… לכן ברור שגוגל היא המנצחת כאן. הסיכוי היחיד של OpenAI להתחרות הוא ע״י סגירת עיסקה עם אפל לשילוב של GPT-4o ישירות בתוך מערכת ההפעלה iOS לטלפונים (ואולי גם macOS למחשבים).יש כמה שמועות בכיוון הזה, אבל נצטרך לחכות לכנס המפתחים של אפל שמתחיל ב-10 ביוני כדי לקבל תשובה סופית בנושא.


עוזרים אישיים

גולת הכותרת של ההדגמה של OpenAI הייתה ״עוזר אישי בזמן אמת״: שיחה קולית עם ChatGPT שנשמעת טבעית לגמרי, עם השהיה נמוכה ואינטונציות של דיבור שמדמות רגשות אנושיים, תוך כדי הפעלה של המצלמה כ-ChatGPT "רואה" את הווידאו החי. באירוע ההשקה המודל החדש עזר לפתור משוואה שנכתבה בכתב יד על נייר והועברה לו ״בשידור חי״ דרך המצלמה של הטלפון. 


למחרת גוגל הדגימה יכולת מאד דומה במסגרת ״פרוייקט אסטרה״, שמשלב וידאו חי מהמצלמה של הטלפון ושיחה קולית עם ג׳מיני. הדמו של גוגל נראה יותר מרשים, וגוגל הבטיחה שהיכולות האלה יכנסו בהמשך השנה למוצרים של גוגל בקטגוריה חדשה שנקראית Gemini Live. נראה שאצל OpenAI זה יקרה קודם, אבל נצטרך לחכות ולראות…


צ׳אטבוטים מותאמים-אישית

בכל פרויקט של הטמעת בינה מלאכותית אצל לקוח אני מגלה שלצ׳אטבוטים המותאמים-אישית של OpenAI, שנקראים Custom GPTs, יש שימושים כמעט בכל מחלקה בארגון. אפשר להעלות כמה מסמכים, להגדיר ״פרומפט מערכת״, ולייצר צ׳אטבוט (בלי לכתוב שורה אחת של קוד) שעושה בדיוק את מה שצריך. למשל: בוט נהלים, מייצר פרסונות או עוזר לתמיכה בלקוחות. השבוע OpenAI הכריזה שהבוטים האלה יהיו זמינים גם למשתמשים החינמיים של ChatGPT - הם יוכלו למצוא אותם בחנות ה-GPT ולהשתמש בהם, אבל בנייה של בוטים תתאפשר רק למשתמשים בתשלום.


גוגל הכריזה השבוע על Gems, שהם גרסאות מותאמות-אישית של ג׳מיני. ה-Gems עדיין לא זמינים,  אבל יגיעו ״בקרוב״ לגירסה בתשלום Gemini Advanced. אז גם כאן ל-OpenAI יש יתרון תחרותי, כי כבר בינואר היו בחנות שלהם מעל ל-3 מיליון  GPTs. 


יצירת ווידאו

גוגל הכריזו על Veo, מודל יצירת ווידאו מטקסט שהוא התשובה שלהם למודל Sora של OpenAI. שני המודלים עוד לא יצאו לשוק, וזמינים רק ליוצרי ווידאו נבחרים. גוגל הראו דמו מוגבל של Veo ביוטיוב, ונראה שהאיכות של סרטוני הווידאו יותר נמוכה מהסרטים שנוצרים ב-Sora. בזמן ההכרזה על Sora בפברואר, חברת OpenAI שיחררה עשרות סרטונים להורדה באיכות מלאה, אז ההתרשמות שלי היא שהמוצר של OpenAI בתחום הזה הוא יותר בשל.


ניתוח ווידאו

המודל של גוגל Gemini 1.5 Pro שזמין למפתחים ב-Google AI Studio תומך בניתוח של סרטי ווידאו באורך של שעה שלמה. המודל הזה זמין עכשיו למשתמשים בתשלום של ג׳מיני (Gemini Advanced), וגוגל הוסיפה תמיכה בקבצים, אבל היכולת של ניתוח ווידאו עוד לא הגיעה ל-Gemini Advanced. גוגל הדגימו השבוע גם חיפוש באמצעות ווידאו, תכונה שמאפשרת למשתמשים להעלות סרט ווידאו ולחפש מידע לגבי התוכן שלו.


חברת OpenAI הדגימה הזרמת ווידאו בזמן אמת למודל שלהם במוצר של העוזר האישי, ויש להם גם דמו אחד באתר של ניתוח ווידאו של מצגת (דוברים ושקפים), אבל הם לא הדגימו ניתוח של סרטים עם תנועה. אז במקרה הזה הניצחון הוא של גוגל - יכולת ניתוח הווידאו שלהם באמת מדהימה, כפי שאפשר לראות בפוסט שהעליתי לפני חודש.


סוכנים עצמאיים

סוכנים עצמאיים של AI הם השלב הבא בהתפתחות של כלי בינה מלאכותית. מגדירים להם מטרה, הם בונים תוכנית כדי להשיג אותה, ואח״כ מבצעים את התוכנית. המנכ״ל של גוגל סונדר פיצ׳אי הדגים כמה ״ניסויים״ שגוגל עושים עם סוכני AI, כמו למשל לארגן החזרה של זוג נעליים: ג׳מיני מוצא את הקבלה במייל, ממלא את טופס ההחזרה באתר של החנות, ואפילו קובע זמן לביצוע המשלוח ביומן. גוגל הדגימו גם יכולות של סוכנים עצמאיים ב-Google Workspace: הסוכן מוצא קבלות במייל ויוצר מהן באופן אוטומטי מסמך של Google Sheets. הדגמה מעניינת נוספת הייתה של חבר צוות ווירטואלי שמשתף פעולה עם צוות אנושי דרך Google Workspace.


חברת OpenAI לא הזכירה באירוע שלה סוכנים עצמאיים בכלל, אז גם במקרה זה ההובלה היא של גוגל, לפחות ברמת החזון.


סיכום

זה היה שבוע עמוס בהכרזות של AI, עם קרב ראש בראש של OpenAI וגוגל על מוצרים חדשים ותכונות מתקדמות. אז מי ניצח בסופו של דבר? אני הייתי מכריז על תיקו: OpenAI מובילים עם הצ׳אטבוט החינמי המשוכלל ביותר, האפליקציה היחידה למחשב, אקוסיסטם מפותח של צ׳אטבוטים מותאמים-אישית, ויצירת ווידאו באיכות גבוהה יותר. גוגל מובילים בשילוב בפלטפורמות קיימות, יכולות מתקדמות של העוזר האישי (העתידי), ניתוח סרטי ווידאו והחזון שלהם לסוכנים עצמאיים. 


ואם אתם רוצים לדעת באיזה מהצ׳אטבוטים עדיף להשתמש היום, ChatGPT או ג׳מיני - פשוט תשאלו אותם!

42 צפיות0 תגובות

פוסטים אחרונים

הצג הכול

Comments


bottom of page