הבינה המלאכותית של גוגל 'אלפא גו אפס' פשוט לחצה על איפוס כיצד ללמוד

זוכר (במעורפל) כיצד למדת ללכת, לדבר, לרכוב על אופניים או לנהוג? זה היה מבולגן ומלא טעויות, אבל הכישורים שלמדת ככה נשארו. מחוץ למערכות החיים, זה היה מאתגר לבנות אלגוריתמים חזקים מספיק כדי לקחת 'ניסיון אמיתי' ולפתח התנהגויות דביקות וניתנות להתאמה לבינה מלאכותית.

ובכן, אלפא גו אפס פשוט עשתה את זה.

'זה מתחיל מלוח ריק ומגלה רק לעצמו, רק ממשחק עצמי, וללא כל ידע אנושי, או כל נתונים אנושיים, או תכונות, או דוגמאות, או התערבות של בני אדם. זה מגלה איך לשחק את המשחק של Go מעקרונות ראשונים ', אומר פרופסור דיוויד סילבר של DeepMind.

ל- AI היו כמה חזרות, כל אחת חכמה ומסוגלת יותר מזו שקדמה לה. הגרסה הקודמת השתמשה במאגר עצום של משחקים קודמים לצד חבורה של אלגוריתמים שהצביעו על זכייה. גישה זו הביאה לתבוסתו של שחקן גו המקצוען האלוף העולמי. בפוקר, ה- AI Libratus עורר לאחרונה את שחקני הפוקר המובילים בעולם בכמעט שני מיליון דולר, גם על ידי למידה באמצעות משחק עצמי במקום נתוני משחק אנושיים.

בעל וגרנר

כעת, בגרסה האחרונה הזו של אלפא גו, לימדה תוכנית הבינה המלאכותית את עצמה איך לשחק ב- Go - ללא רקע אנושי.

לאחר שהריץ מיליוני הדמיות משחק נגד עצמו, לקח לו 40 יום ללמוד - מאפס - כיצד לנצח את גרסת אלופת העולם עצמה. זה באמת משנה משחק, לא רק עבור גו, אלא גם עבור האופן שבו מתגלה ידע חדש. עד כמה המומחיות שלך בתחום מדויקת או מלאה? יש הרבה עוד מה לגלות, מה שאומר לנו הניסוי המרתק הזה בלמידה עם אלפא גו אפס.

'הרעיון של אלפא גו הוא לא לצאת ולהביס בני אדם, אלא למעשה לגלות מה זה אומר לעשות מדע - שתוכנית תוכל ללמוד מעצמה מה זה ידע', על פי סילבר בפוסט ביוטיוב על ההישג.

צוות Alpha Go Zero Deep Mind מכנה זאת עקרון ראשון, 'לימוד טאבולה ראסה'.

'אם אתה יכול להשיג טאבולה ראסה למידה, יש לך סוכן שניתן להשתיל ממשחק Go לכל תחום אחר, והפרטים של המשחק שאתה נמצא בו אתה מעלה אלגוריתם כל כך כללי שהוא יכול להיות מיושם בכל מקום ', הוא אומר . זה רעיון פרובוקטיבי כשאתה מרחיב את הרעיון. רק תחשוב מה נוכל לעשות עם קבוצה של אלגוריתמים חזקים ולמידה שיכולים להתמודד באופן שיטתי עם בעיות קשות וללמוד מהר יותר מהידע הקולקטיבי של הציוויליזציה שלנו. . . בימים ולא בעשורים.

בת כמה כריסטינה טוסי

נכון לעכשיו, ההמרה הגדולה היא, 'האלגוריתמים חשובים הרבה יותר מאשר מחשוב או נתונים זמינים', אמר סילבר. זה לבדו הוא משחק משנה כיצד אנו ניגשים להרחיב את העולם הידוע. בעוד אלפא גו מריצה חומרה של כ -25 מיליון דולר - זו לא בדיוק מערכת קלת משקל - אתם יודעים שגורואים של AI עובדים כבר זמן רב על יצירת ערכות נתונים נקיות יותר וטובות יותר. כיום, מערכי נתונים גדולים רבים נחשבים לרועשים מדי - מלאים בנתונים גרועים - בכדי להכשיר מדויק בינה מלאכותית. אם ה- AI לומד מנתונים והנתונים גרועים, הוא לא לומד. בעיה גדולה.

מה אם לא היית צריך נתונים נקיים, אלא רק ניסיון, והבינה המלאכותית תוכל לאמן את עצמה?

זה ההישג המרגש באלפא גו אפס. למרות שזה בעולם המשחקים הנישה המבוסס על כללים, יש לו השלכות גדולות בכל ענף שעוסק בכללים פיזיקליים - חשוב כימיה, תנועה, ביולוגיה, פרמקולוגיה, נסיעות, לוגיסטיקה וייצור. אם נוכל לתכנן כללים גמישים כל כך שהם יכולים לעבוד מניסיון רחב יותר, וכל כך כיווניים שהם תמיד יוצרים מיומנות חזקה יותר - כמו אלפא גו אפס - אז אפשר להשיג בינה מלאכותית שמבצעת מערכות. מערכות אלו אינן זקוקות לנתונים חיצוניים, ללא בעיות לניקוי נתונים ואינן זקוקות להאטות אנושיות. זו חלקית הסיבה שחברת האם של גוגל, אלפבית, הימרה על החברה על בינה מלאכותית ומשקיעה בבינה מלאכותית בקצב מהיר. (אמזון משקיעה גם בבינה מלאכותית, כמו רכישת ה- BodyLabs האחרונה שלה.)

ursula storage wars שווי נקי

פרופסור Deep Mind, דייוויד סילבר, אומר, 'העובדה שראינו תוכנית שמשיגה ביצועים ברמה גבוהה ... אמורה להיות עכשיו שאנחנו יכולים להתחיל להתמודד עם כמה מהבעיות המאתגרות והמשפיעות ביותר על האנושות.'

פוסט זה עודכן כדי להבהיר כי AI Libratus ניצחה לאחרונה את שחקני הפוקר המובילים באמצעות אסטרטגיה הכוללת משחק עצמי ולא נתונים שהוזנו על ידי האדם.