פינת ה-AI

max256 · אתמול ב- 18:58

הפעם פוסט על בינה מלאכותית מאחד אנונימי.... קריאה מהנה

שני מקרים אמיתיים מהשבוע האחרון השאירו אותי מזועזע. גרמו לי להבין שגם אני לא הפנמתי לגמרי את גודל השינוי.
בראשון, ישבתי בפגישה עם כמה חוקרים במעבדה אקדמית. שאלתי איך הבינה המלאכותית יכולה לעזור להם, והם אמרו שאם רק היה כלי שהיה יכול לעבור על כל תוצרי המחקרים מדי שבוע ולהבין מה המשמעויות ואיפה יש אנומליות, זה היה יכול להיות נחמד מאד.
הסברתי להם בחיוך שהם בעצם רוצים דוקטור אנושי: מישהו שמבין במדע ברמה גבוהה בתת-תחום מסוים מצד אחד, ומהצד השני גם יודע איך לחקור, להסיק מסקנות, לנתח נתונים, לחשוב בהיגיון. הם הסכימו, וחייכו גם כן. הרי אין כלי ברמה כזו. פשוט אין. אם היה, היינו כבר יכולים להחליף את החוקר האנושי בחוקר ממוחשב ודי.
ואז אמרתי לעצמי: בעצם, למה לא לנסות את GPT O1?
כדי להבהיר: לא מדובר ב- ChatGPT הרגיל שרוב מכריע של האנושות משתמשים בו. זוהי גרסת הקצה-של-הקצה מבחינת יכולות הבינה המלאכותית. יש כבר קרוב-לקונצנזוס שהוא עונה על שאלות מדעיות ברמה של דוקטור בינוני. כלומר, של מומחה. אז למה באמת שלא ינתח תוצרי מחקרים?
אז ניסינו.
מנהל המעבדה הביא את האקסל שריכז את כל הנתונים. לקחנו את הטבלה המרכזית, עם עשרים ניסויים שונים, כל אחד מהם עם תוצאות שונות. המרתי את האקסל במהירות לפורמט ש- O1 היה יכול לקבל, זרקתי לתוך המנוע, הוספתי הסבר על הניסויים וביקשתי ממנו למצוא אנומליות. חיברתי את המחשב למקרן כדי שכולם יוכלו לראות את התוצאות, ואז חיכינו. הוא חשב דקה. שתי דקות. למול עינינו הוא פרס את קו המחשבה שלו, כשניתח את הטבלה, חיפש אנומליות ומשמעויות חבויות.
בסוף שתי הדקות, הוא סיפק כמה היפותזות לדברים שלא הסתדרו בניסויים. אחת מהן הייתה בדיוק זו שגם החוקרים האנושיים זיהו בעצמם. האחרות היו שגויות לגמרי, ונבעו מכך שלא המרתי נכון את האקסל. ואז הוא סיכם את כל מה שמצא - ואמר לנו בעצמו שכנראה שטעינו בהמרת הקובץ, וזו הסיבה האמיתית לרוב הבעיות.
שתיקה בחלל החדר. אנחנו מסתכלים זה על זה, ולא בטוחים מה להגיד. O1 עשה עכשיו עבודת ניתוח של דוקטור לכימיה, פלוס מומחה לאקסל ועיבוד נתונים, בשתי דקות. הוא זיהה מתוך אוסף רב של נתונים את המחט בערימת השחת, והסביר את עצמו בצורה מושלמת והגיונית. והוא גם זיהה איפה אנחנו, בני-האדם, טעינו במידע שהזנו לו.
בסוף מנהל המעבדה מכחכח בגרונו ושואל - "הוא יכול גם לנהל מעבדה?"
אנחנו מחליטים לבדוק גם את זה, וזה המקרה השני.
המנהל מספר לי על בעיה גדולה שיש לו: בני-אדם מנסים לעבוד עליו. הוא צריך להרים ניסוי חדש, עם מכונה חדשה בעלות גבוהה. הוא צריך לקבל ייעוץ ממדענים לגבי המכונה המתאימה ביותר, עם הרכיבים המתאימים לצרכים שלו. אבל המדענים מייצגים את היצרנים, ונותנים לו הערכות מוטות לטובת כל יצרן. אז הוא צריך להצליב בין דרישות המעבדה שלו ומה צריך כל מכשיר להשיג ואיך בדיוק, לבין פירוט המכונה שכל נציג חברה מעביר לו. וכמובן שנציגי החברות מנסים לבלבל אותו עם הצעות מחיר של עשרות-אלפי מילים, רשימות רכיבים עם שמות שונים, יכולות והספקים ביחידות שונות ובתיאורים שונים ממה שהוא ציין, ועוד תרמיות מהסוג הזה. רק מנהל מעבדה מיומן יכול לקרוא בין השורות ולהבין איפה הצעות המחיר שונות ממה שהוא באמת מבקש. רק למנהל המעבדה יש את הניסיון הנחוץ כדי לזהות את הדקויות האלו.
גם ל- O1 זה היה קשה. לקח לו הפעם שתיים וחצי דקות. הוא עבר על כמעט 30,000 מילים, ובסוף הפיק דו"ח. אין לי מילה אחרת לזה. פשוט דו"ח של "אנליזת פערים", שמפרט מה מנהל המעבדה רצה, איפה הספק לא עומד בציפיות, ועוד מוסיף מה יהיו המשמעויות עבור עבודת המעבדה, אם ההצעה של הספק תתקבל. והמנהל עובר על הכל ומהנהן. כן, הבינה המלאכותית זיהתה את הנקודה הזאת שגם הוא הבחין בה, וגם את זאת, וגם את זאת, וגם את זאת. אבל למנהל האנושי זה לקח יום שלם, ועוד עשר שנים של ניסיון בתחום. לבינה המלאכותית לקח פחות משלוש דקות בזמן אמת.
ושוב אנחנו מסתכלים זה על זה, ולא בטוחים מה להגיד. אנחנו מרגישים שאנחנו על ספו של עידן חדש. כי כמו שאני אומר להם ומזכיר לעצמי בשקט, O1 כבר עומד להתחלף בעוד כמה חודשים ב- O3, שאמור להיות ברמה גבוהה יותר. משמעותית יותר. דיוויד שפירו, אחד המומחים לבינה מלאכותית טען לאחרונה של- O1 יש אייקיו של 133. לדור הבא, O3, אמור להיות אייקיו של 145. זה ממוצע האייקיו של זוכי פרס נובל. והוא עומד להיות בידיים של כל ארגון. כל מעבדה. כל אדם.
איפה עוד יכולה להיכנס בינה מלאכותית כזו, ולהגיע להישגים של מומחה עם ניסיון של שנים ארוכות? מה היא תעשה בכל תחומי המדע? איך היא תרומם את הרפואה, כשלכל אדם יהיה ידע של רופא מומחה? מה היא תעשה לחקלאות, כשכל חקלאי יהיה גם חוקר צמחים מדופלם, ומפעיל כטב"מים לניטור השטח, ועוד ועוד? מה יקרה בבתי המשפט, כשהבינה המלאכותית תגיע לרמה של שופט?
אני לא יודע. אני רק יודע שאנחנו צריכים לנסות. בכל תחום ותחום, צריך להתחיל להתנסות עם הבינה המלאכותית. בהמון זהירות והמון חשדנות - אל תסמכו על ChatGPT בשום פנים ואופן, אם אתם לא מבינים את התחום שלכם ברמה גבוהה, ורצוי גם ברזי הבינה המלאכותית. צריך לדעת ולהבין איזה כלים מתאימים לאיזה מטרות, איזה ישקרו לכם בלי למצמץ ואיזה יביאו לכם תשובות רציניות. אבל אם לא תנסו, לא תדעו אפילו שהמהפכה כבר הגיעה, ואיך היא יכולה לשרת גם את התחום שלכם.
בהצלחה. עומד להיות מאד מעניין בשנים הקרובות.

vinney · היום ב- 10:39

אתה מבלבל דברים שונים. לרכז מידע, ולהצליב מידע, לעבד כמויות גדולות של מידע - זה בדיוק נקודת החוזק של מערכות למידה ממוחשבת (מה שנקרא בשפת העמ'ך "AI").

"רמת שופט" זה מה? לקבל החלטות? לשקול שיקולים? להעריך אמינות של עדויות ומשקל של ראיות? מסוכנות החשוד וטובת הילד? איך בדיוק AI יעשה את זה? שופטים שונים יכולים להגיע למסקנות שונות למשמע אותן עדויות בדיוק ולמראה אותן הראיות בדיוק, הרי לא סתם בתיקים יותר משמעותיים ומורכבים יושבים הרכבים של שלושה שופטים ולא שופט בודד. אם בני אדם לא יכולים להגיע להחלטה דטרמיניסטית, למה שAI יהיה מסוגל? ואם הוא לא מסוגל - איזו בדיוק החלטה הAI יקבל, ועל סמך אילו שיקולים? הרי הפלט הטקסטואלי של ChatGPT ודומיו לא באמת מפרט את המשקלים האמיתיים שניתנו לכל תו בקלט, ולראיה קל מאוד לבלבל אותם ולגרום להם להוציא שקרים והזיות כששואלים שאלות לכאורה טריויאליות על דברים קלים לבדיקה עובדתית.

Lucifer LightBringer · אתמול ב- 19:15

זה בסדר יש בעיות שגם בינה מלאכותית לא מסוגלת לפתור...

user32 · היום ב- 10:13

הדוגמאות שנתת הן מקרים קלאסיים שבו AI מציג פתרון מושלם וזה לא מרשים במיוחד. אגב, לדעתי גם AI בינוני ומטה יתן תוצאות טובות. התנאים שאתה מזין לאלגוריתם:
טקסט מנוסח היטב ברמה הכי מדוייקת שיש, עם כללי כתיבה מוגדרים מראש.
סט למידה גדול ונוח לעיבוד. סביר להניח שהבוט למד כללי כתיבה אקדמית מתוך עשרות מליוני מחקרים שאונדקסו אצלו.
ובנוסף דאטה בפורמט טבלאי (הזכרת אקסל) זה בכלל גן עדן לAI.
אותו כנ"ל לגבי המקרה של מפרטי היצרן. אני זוכר סטארטאפ לפני 20 שנה שבAI של אז היה משווה בין מפרטי יצרן שמנוסחים באתרי קניות כדי לספק פלטפורמה מאחדת.
במקרה של מחקר בכימיה זה עוד יותר קל (בניגוד נגיד למחקר במדעי החברה והרוח) כי קיימת שפה פורמלית לנוסחאות כימיות וסימונים מוסכמים.
לעומת זאת "רמת שופט" בבתי המשפט זה משהו יותר מעניין. AI יכול היום להוציא פסק דין גנרי מנוסח היטב שהקורא הממוצע לא יידע לזהות שנכתב על ידי מחשב. אבל האם הוא מוסרי? האם מחשב ייתן משקלים נכונים לכל שיקול? האם AI יתחשב גם בדברים מעבר לחוק היבש כמו נסיבות מיוחדות, השלכות פוליטיות והאינטרס הציבורי? האם זה בכלל תפקידו של שופט להתייחס לשיקולים כאלה שלא כתובים במפורש בחוק היבש?

user32 · היום ב- 11:34

שכחתי עוד משהו: הזכרת תשובות של "דוקטור בינוני" וזה הזכיר לי. חלק גדול מאוד מהמחקרים האקדמיים והמאמרים הוא מריחה, קשקושיאדה, והמון קופי פייסט. כמו כן, חלק גדול מהכתיבה האקדמית היא הקדמה, מבוא, סיכום של מאמרים קודמים, הבאת סימוכין והפניות מקום, פירוט גישות, תיאוריות והנחות עבודה קיימות, והעתקה וסיכום של כמות גדולה של מידע ממקורות שונים. בנושאים האלה לAI יש יתרון אדיר על כותב אנושי. מחשב כותב בשניה מה שאני כסטונדט קיללתי וירקתי דם כדי לנסח עבודה סמינריונית של 20 עמודים כשאת הרעיון היצירתי שלי היה אפשר לנסח מצויין בעמוד אחד.
לא סתם תחום העבודות אקדמיות ובפרט דוקוטורטים בתשלום פורח בשנים האחרונות ובמיוחד בניגריה שם סטודנט עני יכתוב לך עבודת תזה תמורת כמה מאות או אלפי דולרים בודדים וזה יעבור בהצלחה באוניברסיטת עילית אמריקאית.
מה שגורם לתהיה איזה ערך יש לאקדמיה בצורתו הנוכחית בעידן של מחשבים? ובפרט בחוגים הפחות מדעיים.

פינת ה-AI

max256

Member

vinney

Well-known member

Lucifer LightBringer

Well-known member

user32

Well-known member

user32

Well-known member