עיקרי לְחַדֵשׁ AI החדש של טקסט לדיבור של גוגל כל כך טוב שאנחנו מתערבים שאתה לא יכול להגיד את זה מאדם אמיתי

AI החדש של טקסט לדיבור של גוגל כל כך טוב שאנחנו מתערבים שאתה לא יכול להגיד את זה מאדם אמיתי

ההורוסקופ שלך למחר

האם אתה יכול להבדיל בין דיבור ממוחשב שנוצר על ידי AI לבין בן אדם אמיתי וחי? אולי תמיד חשבת שתוכל. אולי אתה אוהב את אלכסה וסירי אבל מאמין שלעולם לא תבלבל את אחת מהן עם אישה אמיתית.

הדברים עומדים להיות הרבה יותר מעניינים. מהנדסי גוגל עבדו קשה על יצירת מערכת טקסט לדיבור בשם טקוטרון 2 . על פי א עיתון הם פרסמו החודש, המערכת יוצרת לראשונה ספקטרוגרמה של הטקסט, ייצוג חזותי לאופן שבו הדיבור צריך להישמע. תמונה זו מועברת באמצעות האלגוריתם הקיים של גוגל, המשתמש בתמונה להפקת דיבור אנושי נשמע טבעי ביותר.

כמה שווה קורטני פורס

באמצעות שיטה זו החוקרים מדווחים כי 'המודל שלנו משיג ציון דעה ממוצע (MOS) של 4.53 בהשוואה ל- MOS של 4.58 לדיבור מוקלט באופן מקצועי'. (ציון דעה ממוצע הוא מונח טלקומוניקציה המודד עד כמה משהו נשמע אמיתי לחיים.)

כפי שמדגימות דוגמאות האודיו של גוגל, טקוטרון 2 יכול לזהות מההקשר את ההבדל בין שם העצם 'מדבר' לפועל 'מדבר', כמו גם שם העצם 'נוכח' ופועל 'נוכח', ולשנות את הגייתו בהתאם. זה יכול לשים דגש על מילים באותיות רישיות ולהחיל את הטיה הנכונה כששואלים שאלה במקום להצהיר.

וזה יכול ליצור טקסט שנשמע כל כך דומה לדיבור אנושי שקשה או בלתי אפשרי לדעת את ההבדל. אם אתה רוצה לראות כמה זה קשה, עבור אל Google דף דוגמאות שמע , וגלול מטה לקבוצת הדוגמאות האחרונה שכותרתה 'טקוטרון 2 או אנושי?' שם תמצאו את טקוטרון 2 ואדם אמיתי שכל אחד מהם אומר משפטים כמו 'הילדה ההיא עשתה סרטון על שפתון' מלחמת הכוכבים '.'

התראת ספוילר: כדי לבדוק את עצמך, הקשב לדגימות ונחש מה זה לפני שקראת את שאר הטור הזה.

אז אילו דוגמאות הן טקסט לדיבור ואילו הם קול אנושי אמיתי? המהנדסים של גוגל לא אומרים אבל הם השאירו רמז גדול מאוד. לכל אחת מדגימות הקובץ .wav יש שם קובץ המכיל את המונח 'gen' או 'gt'. בהתבסס על העיתון, סביר מאוד ש- 'gen' מציין דיבור שנוצר על ידי טקוטרון 2, ו- 'gt' הוא דיבור אנושי אמיתי. ('GT' מייצג ככל הנראה 'אמת קרקעית', מונח למידת מכונה שמשמעותו בעצם 'העסקה האמיתית'.)

בהנחה שזה נכון, להלן התשובות למבחן:

דיאנה טאורסי שווי נטו 2015

'הבחורה ההיא עשתה סרטון על שפתון מלחמת הכוכבים.'

מדגם 1: אנושי אמיתי

מדגם 2: טקוטרון 2

'היא סיימה דוקטורט בסוציולוגיה מאוניברסיטת קולומביה.'

דוגמא 1: טקוטרון 2

מדגם 2: אנושי אמיתי

'ג'ורג 'וושינגטון היה הנשיא הראשון של ארצות הברית.'

דוגמא 1: טקוטרון 2

מדגם 2: אנושי אמיתי

שווי נטו של ace frehley 2016

'אני עסוק מדי בשביל רומנטיקה.'

מדגם 1: אנושי אמיתי

מדגם 2: טקוטרון 2

כמה קיבלתם נכון? והאם אתה יכול באמת להבדיל, או שאתה פשוט צריך לנחש?