הפעם פוסט על בינה מלאכותית מאחד אנונימי.... קריאה מהנה
שני מקרים אמיתיים מהשבוע האחרון השאירו אותי מזועזע. גרמו לי להבין שגם אני לא הפנמתי לגמרי את גודל השינוי.
בראשון, ישבתי בפגישה עם כמה חוקרים במעבדה אקדמית. שאלתי איך הבינה המלאכותית יכולה לעזור להם, והם אמרו שאם רק היה כלי שהיה יכול לעבור על כל תוצרי המחקרים מדי שבוע ולהבין מה המשמעויות ואיפה יש אנומליות, זה היה יכול להיות נחמד מאד.
הסברתי להם בחיוך שהם בעצם רוצים דוקטור אנושי: מישהו שמבין במדע ברמה גבוהה בתת-תחום מסוים מצד אחד, ומהצד השני גם יודע איך לחקור, להסיק מסקנות, לנתח נתונים, לחשוב בהיגיון. הם הסכימו, וחייכו גם כן. הרי אין כלי ברמה כזו. פשוט אין. אם היה, היינו כבר יכולים להחליף את החוקר האנושי בחוקר ממוחשב ודי.
ואז אמרתי לעצמי: בעצם, למה לא לנסות את GPT O1?
כדי להבהיר: לא מדובר ב- ChatGPT הרגיל שרוב מכריע של האנושות משתמשים בו. זוהי גרסת הקצה-של-הקצה מבחינת יכולות הבינה המלאכותית. יש כבר קרוב-לקונצנזוס שהוא עונה על שאלות מדעיות ברמה של דוקטור בינוני. כלומר, של מומחה. אז למה באמת שלא ינתח תוצרי מחקרים?
אז ניסינו.
מנהל המעבדה הביא את האקסל שריכז את כל הנתונים. לקחנו את הטבלה המרכזית, עם עשרים ניסויים שונים, כל אחד מהם עם תוצאות שונות. המרתי את האקסל במהירות לפורמט ש- O1 היה יכול לקבל, זרקתי לתוך המנוע, הוספתי הסבר על הניסויים וביקשתי ממנו למצוא אנומליות. חיברתי את המחשב למקרן כדי שכולם יוכלו לראות את התוצאות, ואז חיכינו. הוא חשב דקה. שתי דקות. למול עינינו הוא פרס את קו המחשבה שלו, כשניתח את הטבלה, חיפש אנומליות ומשמעויות חבויות.
בסוף שתי הדקות, הוא סיפק כמה היפותזות לדברים שלא הסתדרו בניסויים. אחת מהן הייתה בדיוק זו שגם החוקרים האנושיים זיהו בעצמם. האחרות היו שגויות לגמרי, ונבעו מכך שלא המרתי נכון את האקסל. ואז הוא סיכם את כל מה שמצא - ואמר לנו בעצמו שכנראה שטעינו בהמרת הקובץ, וזו הסיבה האמיתית לרוב הבעיות.
שתיקה בחלל החדר. אנחנו מסתכלים זה על זה, ולא בטוחים מה להגיד. O1 עשה עכשיו עבודת ניתוח של דוקטור לכימיה, פלוס מומחה לאקסל ועיבוד נתונים, בשתי דקות. הוא זיהה מתוך אוסף רב של נתונים את המחט בערימת השחת, והסביר את עצמו בצורה מושלמת והגיונית. והוא גם זיהה איפה אנחנו, בני-האדם, טעינו במידע שהזנו לו.
בסוף מנהל המעבדה מכחכח בגרונו ושואל - "הוא יכול גם לנהל מעבדה?"
אנחנו מחליטים לבדוק גם את זה, וזה המקרה השני.
המנהל מספר לי על בעיה גדולה שיש לו: בני-אדם מנסים לעבוד עליו. הוא צריך להרים ניסוי חדש, עם מכונה חדשה בעלות גבוהה. הוא צריך לקבל ייעוץ ממדענים לגבי המכונה המתאימה ביותר, עם הרכיבים המתאימים לצרכים שלו. אבל המדענים מייצגים את היצרנים, ונותנים לו הערכות מוטות לטובת כל יצרן. אז הוא צריך להצליב בין דרישות המעבדה שלו ומה צריך כל מכשיר להשיג ואיך בדיוק, לבין פירוט המכונה שכל נציג חברה מעביר לו. וכמובן שנציגי החברות מנסים לבלבל אותו עם הצעות מחיר של עשרות-אלפי מילים, רשימות רכיבים עם שמות שונים, יכולות והספקים ביחידות שונות ובתיאורים שונים ממה שהוא ציין, ועוד תרמיות מהסוג הזה. רק מנהל מעבדה מיומן יכול לקרוא בין השורות ולהבין איפה הצעות המחיר שונות ממה שהוא באמת מבקש. רק למנהל המעבדה יש את הניסיון הנחוץ כדי לזהות את הדקויות האלו.
גם ל- O1 זה היה קשה. לקח לו הפעם שתיים וחצי דקות. הוא עבר על כמעט 30,000 מילים, ובסוף הפיק דו"ח. אין לי מילה אחרת לזה. פשוט דו"ח של "אנליזת פערים", שמפרט מה מנהל המעבדה רצה, איפה הספק לא עומד בציפיות, ועוד מוסיף מה יהיו המשמעויות עבור עבודת המעבדה, אם ההצעה של הספק תתקבל. והמנהל עובר על הכל ומהנהן. כן, הבינה המלאכותית זיהתה את הנקודה הזאת שגם הוא הבחין בה, וגם את זאת, וגם את זאת, וגם את זאת. אבל למנהל האנושי זה לקח יום שלם, ועוד עשר שנים של ניסיון בתחום. לבינה המלאכותית לקח פחות משלוש דקות בזמן אמת.
ושוב אנחנו מסתכלים זה על זה, ולא בטוחים מה להגיד. אנחנו מרגישים שאנחנו על ספו של עידן חדש. כי כמו שאני אומר להם ומזכיר לעצמי בשקט, O1 כבר עומד להתחלף בעוד כמה חודשים ב- O3, שאמור להיות ברמה גבוהה יותר. משמעותית יותר. דיוויד שפירו, אחד המומחים לבינה מלאכותית טען לאחרונה של- O1 יש אייקיו של 133. לדור הבא, O3, אמור להיות אייקיו של 145. זה ממוצע האייקיו של זוכי פרס נובל. והוא עומד להיות בידיים של כל ארגון. כל מעבדה. כל אדם.
איפה עוד יכולה להיכנס בינה מלאכותית כזו, ולהגיע להישגים של מומחה עם ניסיון של שנים ארוכות? מה היא תעשה בכל תחומי המדע? איך היא תרומם את הרפואה, כשלכל אדם יהיה ידע של רופא מומחה? מה היא תעשה לחקלאות, כשכל חקלאי יהיה גם חוקר צמחים מדופלם, ומפעיל כטב"מים לניטור השטח, ועוד ועוד? מה יקרה בבתי המשפט, כשהבינה המלאכותית תגיע לרמה של שופט?
אני לא יודע. אני רק יודע שאנחנו צריכים לנסות. בכל תחום ותחום, צריך להתחיל להתנסות עם הבינה המלאכותית. בהמון זהירות והמון חשדנות - אל תסמכו על ChatGPT בשום פנים ואופן, אם אתם לא מבינים את התחום שלכם ברמה גבוהה, ורצוי גם ברזי הבינה המלאכותית. צריך לדעת ולהבין איזה כלים מתאימים לאיזה מטרות, איזה ישקרו לכם בלי למצמץ ואיזה יביאו לכם תשובות רציניות. אבל אם לא תנסו, לא תדעו אפילו שהמהפכה כבר הגיעה, ואיך היא יכולה לשרת גם את התחום שלכם.
בהצלחה. עומד להיות מאד מעניין בשנים הקרובות.
שני מקרים אמיתיים מהשבוע האחרון השאירו אותי מזועזע. גרמו לי להבין שגם אני לא הפנמתי לגמרי את גודל השינוי.
בראשון, ישבתי בפגישה עם כמה חוקרים במעבדה אקדמית. שאלתי איך הבינה המלאכותית יכולה לעזור להם, והם אמרו שאם רק היה כלי שהיה יכול לעבור על כל תוצרי המחקרים מדי שבוע ולהבין מה המשמעויות ואיפה יש אנומליות, זה היה יכול להיות נחמד מאד.
הסברתי להם בחיוך שהם בעצם רוצים דוקטור אנושי: מישהו שמבין במדע ברמה גבוהה בתת-תחום מסוים מצד אחד, ומהצד השני גם יודע איך לחקור, להסיק מסקנות, לנתח נתונים, לחשוב בהיגיון. הם הסכימו, וחייכו גם כן. הרי אין כלי ברמה כזו. פשוט אין. אם היה, היינו כבר יכולים להחליף את החוקר האנושי בחוקר ממוחשב ודי.
ואז אמרתי לעצמי: בעצם, למה לא לנסות את GPT O1?
כדי להבהיר: לא מדובר ב- ChatGPT הרגיל שרוב מכריע של האנושות משתמשים בו. זוהי גרסת הקצה-של-הקצה מבחינת יכולות הבינה המלאכותית. יש כבר קרוב-לקונצנזוס שהוא עונה על שאלות מדעיות ברמה של דוקטור בינוני. כלומר, של מומחה. אז למה באמת שלא ינתח תוצרי מחקרים?
אז ניסינו.
מנהל המעבדה הביא את האקסל שריכז את כל הנתונים. לקחנו את הטבלה המרכזית, עם עשרים ניסויים שונים, כל אחד מהם עם תוצאות שונות. המרתי את האקסל במהירות לפורמט ש- O1 היה יכול לקבל, זרקתי לתוך המנוע, הוספתי הסבר על הניסויים וביקשתי ממנו למצוא אנומליות. חיברתי את המחשב למקרן כדי שכולם יוכלו לראות את התוצאות, ואז חיכינו. הוא חשב דקה. שתי דקות. למול עינינו הוא פרס את קו המחשבה שלו, כשניתח את הטבלה, חיפש אנומליות ומשמעויות חבויות.
בסוף שתי הדקות, הוא סיפק כמה היפותזות לדברים שלא הסתדרו בניסויים. אחת מהן הייתה בדיוק זו שגם החוקרים האנושיים זיהו בעצמם. האחרות היו שגויות לגמרי, ונבעו מכך שלא המרתי נכון את האקסל. ואז הוא סיכם את כל מה שמצא - ואמר לנו בעצמו שכנראה שטעינו בהמרת הקובץ, וזו הסיבה האמיתית לרוב הבעיות.
שתיקה בחלל החדר. אנחנו מסתכלים זה על זה, ולא בטוחים מה להגיד. O1 עשה עכשיו עבודת ניתוח של דוקטור לכימיה, פלוס מומחה לאקסל ועיבוד נתונים, בשתי דקות. הוא זיהה מתוך אוסף רב של נתונים את המחט בערימת השחת, והסביר את עצמו בצורה מושלמת והגיונית. והוא גם זיהה איפה אנחנו, בני-האדם, טעינו במידע שהזנו לו.
בסוף מנהל המעבדה מכחכח בגרונו ושואל - "הוא יכול גם לנהל מעבדה?"
אנחנו מחליטים לבדוק גם את זה, וזה המקרה השני.
המנהל מספר לי על בעיה גדולה שיש לו: בני-אדם מנסים לעבוד עליו. הוא צריך להרים ניסוי חדש, עם מכונה חדשה בעלות גבוהה. הוא צריך לקבל ייעוץ ממדענים לגבי המכונה המתאימה ביותר, עם הרכיבים המתאימים לצרכים שלו. אבל המדענים מייצגים את היצרנים, ונותנים לו הערכות מוטות לטובת כל יצרן. אז הוא צריך להצליב בין דרישות המעבדה שלו ומה צריך כל מכשיר להשיג ואיך בדיוק, לבין פירוט המכונה שכל נציג חברה מעביר לו. וכמובן שנציגי החברות מנסים לבלבל אותו עם הצעות מחיר של עשרות-אלפי מילים, רשימות רכיבים עם שמות שונים, יכולות והספקים ביחידות שונות ובתיאורים שונים ממה שהוא ציין, ועוד תרמיות מהסוג הזה. רק מנהל מעבדה מיומן יכול לקרוא בין השורות ולהבין איפה הצעות המחיר שונות ממה שהוא באמת מבקש. רק למנהל המעבדה יש את הניסיון הנחוץ כדי לזהות את הדקויות האלו.
גם ל- O1 זה היה קשה. לקח לו הפעם שתיים וחצי דקות. הוא עבר על כמעט 30,000 מילים, ובסוף הפיק דו"ח. אין לי מילה אחרת לזה. פשוט דו"ח של "אנליזת פערים", שמפרט מה מנהל המעבדה רצה, איפה הספק לא עומד בציפיות, ועוד מוסיף מה יהיו המשמעויות עבור עבודת המעבדה, אם ההצעה של הספק תתקבל. והמנהל עובר על הכל ומהנהן. כן, הבינה המלאכותית זיהתה את הנקודה הזאת שגם הוא הבחין בה, וגם את זאת, וגם את זאת, וגם את זאת. אבל למנהל האנושי זה לקח יום שלם, ועוד עשר שנים של ניסיון בתחום. לבינה המלאכותית לקח פחות משלוש דקות בזמן אמת.
ושוב אנחנו מסתכלים זה על זה, ולא בטוחים מה להגיד. אנחנו מרגישים שאנחנו על ספו של עידן חדש. כי כמו שאני אומר להם ומזכיר לעצמי בשקט, O1 כבר עומד להתחלף בעוד כמה חודשים ב- O3, שאמור להיות ברמה גבוהה יותר. משמעותית יותר. דיוויד שפירו, אחד המומחים לבינה מלאכותית טען לאחרונה של- O1 יש אייקיו של 133. לדור הבא, O3, אמור להיות אייקיו של 145. זה ממוצע האייקיו של זוכי פרס נובל. והוא עומד להיות בידיים של כל ארגון. כל מעבדה. כל אדם.
איפה עוד יכולה להיכנס בינה מלאכותית כזו, ולהגיע להישגים של מומחה עם ניסיון של שנים ארוכות? מה היא תעשה בכל תחומי המדע? איך היא תרומם את הרפואה, כשלכל אדם יהיה ידע של רופא מומחה? מה היא תעשה לחקלאות, כשכל חקלאי יהיה גם חוקר צמחים מדופלם, ומפעיל כטב"מים לניטור השטח, ועוד ועוד? מה יקרה בבתי המשפט, כשהבינה המלאכותית תגיע לרמה של שופט?
אני לא יודע. אני רק יודע שאנחנו צריכים לנסות. בכל תחום ותחום, צריך להתחיל להתנסות עם הבינה המלאכותית. בהמון זהירות והמון חשדנות - אל תסמכו על ChatGPT בשום פנים ואופן, אם אתם לא מבינים את התחום שלכם ברמה גבוהה, ורצוי גם ברזי הבינה המלאכותית. צריך לדעת ולהבין איזה כלים מתאימים לאיזה מטרות, איזה ישקרו לכם בלי למצמץ ואיזה יביאו לכם תשובות רציניות. אבל אם לא תנסו, לא תדעו אפילו שהמהפכה כבר הגיעה, ואיך היא יכולה לשרת גם את התחום שלכם.
בהצלחה. עומד להיות מאד מעניין בשנים הקרובות.