תוכן עניינים:
- כיצד למידה עמוקה מייצרת קולות אנושיים
- לשחזר את קולו של אדם חסר קול
- איזון השימושים השליליים של סינתיסייזרים של AI
וִידֵאוֹ: ♪ "Like An Enderman" - Minecraft Song (נוֹבֶמבֶּר 2024)
בשנת 2017, טרשת עורקים עממית (ALS), הפרעה נוירולוגית הרסנית, שדדה את פט קווין, מייסד אתגר דלי הקרח המפורסם, את יכולתו לדבר.
בזכות ההתקדמות בלימוד מכונות ולמידה עמוקה, אלגוריתמים של בינה מלאכותית הפכו טובים מאוד לחיקוי בני אדם. אך בעוד שהתפתחויות בולטות רבות במרחב היו שליליות, כוח החיקוי של AI היה כוח של שינוי חיובי עבור קווין.
"רוב האנשים החיים עם ALS (המכונה גם מחלת נוירון מוטורי) בסופו של דבר משותקים ואינם יכולים לתקשר עם שום דבר מלבד קולות 'מחשב' מלאכותיים", אומר אוסקר ווסטרדל, ממייסד פרויקט Revoice, יוזמה שמטרתה לעזור לחולי ALS כמו קווין..
כדי ליצור מחדש את קולו של קווין, Project Revoice שיתף פעולה עם Lyrebird, אחת מקומץ חברות שמשתמשות ב- AI בכדי לשכפל את קולו של אדם - קבוצה הכוללת גם את WaveNet ו- Voicery של גוגל, סטארט-אפ מגובה של קומבינטור המשתמש ב- AI כדי ליצור הקלטות קול מסונתזות..
כיצד למידה עמוקה מייצרת קולות אנושיים
מאחורי יישומים אלה עומדים אלגוריתמים למידה עמוקה, ענף פופולרי של AI העוסק בסטים גדולים של נתונים לצורך תובנות ודפוסים שלא ניתן לתפוס באמצעות תוכנה מסורתית מבוססת כללי. כשאתה מאמן סינתיסייזר קולי לומד עם מספיק הקלטות קוליות, הוא יוצר מודל דיגיטלי המייצג את הקול של האדם ויכול להפיק דוגמאות קול חדשות.
לפני כניסת טכנולוגיית הסינתזה הקולית המופעלת על ידי AI, חולי ALS נאלצו להשתמש בקולות דיגיטליים גנריים שלא היו שלהם. טכנולוגיות אחרות יכלו לתפור משפטים שהוקלטו מראש עם קולו של המטופל, אך התוצאות היו מלאכותיות מדי והצריכו עשרות שעות של הקלטות קוליות בכדי שיהיה בהן שימוש מינימלי.
יישומים של למידה עמוקה, לעומת זאת, דורשים הרבה פחות נתונים ומספקים תוצאות טובות יותר. "מה שלרייברד יכול להשיג רק עם שעתיים של שמע הוא מדהים - זה נותן לאנשים שיבוט קולי דיגיטלי שלם, כך שהם יכולים להגיד כל מה שהם רוצים, " אומר ווסטרדל.
לשחזר את קולו של אדם חסר קול
אחד המגבלות של יישומי למידה עמוקה הוא התלות שלהם במדגמי נתונים באיכות גבוהה לאימון הרשתות העצביות שלהם. הבעיה עם חולי ALS היא שברגע שהם מאבדים את קולם, הקלטת דגימות קוליות היא בלתי אפשרית. למרבה המזל, לקווין היו שעות של מוקדי מפתח וראיונות מוקלטים.
"האתגר הגדול ביותר היה האיכות. הטכנולוגיה הזו תלויה לחלוטין בהקלטות קבועות ואיכותיות העוקבות גם אחר תסריט מדויק - ולכן היינו צריכים לעבוד עם אולפן סאונד כדי 'לשחזר' ידנית ולהעתיק כל קו דיאלוג שיכולנו למצוא של פט, "אומר ווסטרדל.
"קצת פחדנו שלא נוכל לספק איכות נהדרת ליצירת קולו של פאט", אומר ז'וזה סוטלו, ממייסד ליברד. "מכיוון שלא הצלחנו להשיג הקלטות נקיות, האיכות הסופית של הקול המלאכותי אינה מושלמת. אנו חושבים שנוכל לעשות עבודה הרבה יותר טובה עם הקלטות נקיות."
התוצאות עדיין נשמעות מעט לא טבעיות וסינתטיות. אבל עבור קווין, שהשתמש בקול גנרי כדי לתקשר, ההבדל היה דרמטי. "לאחר ששמעתי את קולי דרך הטכנולוגיה החדשה הזו, הייתי מפוצץ! בשביל שהמטופלים יידעו שהם יכולים לקבל את הקול שלהם לאחר ש- ALS יסלק אותו, זה ישנה את האופן שבו אנשים חיים עם ALS, " הוא אומר.
קווין ממליץ לחולי ALS להקליט את קולם לפני שיהיה מאוחר מדי. "לאחר ששמעתי את קולי שוב, אני זקוק לחולי ALS שידעו שההקלטה של הקול שלהם חשובה להפליא, " הוא אומר.
איזון השימושים השליליים של סינתיסייזרים של AI
מוקדם יותר השנה, FakeApp, אפליקציה להחלפת פנים באמצעות AI, הפעילה מתקפה של סרטונים פורנוגרפיים מזויפים ובהם ידוענים ופוליטיקאים. יש חשש שיישומים כמו FakeApp ולרייברד יפתחו עידן חדש של חדשות, הונאה וזיוף מזויפים.
דף האתיקה באתר Lyrebird הכיר בעבר כי הטכנולוגיה עשויה "להיות בעלת השלכות מסוכנות כמו הטעיית דיפלומטים, הונאה, ובאופן כללי יותר כל בעיה אחרת הנגרמת כתוצאה מגניבת זהות של מישהו אחר."
כדי לוודא את העניין, באתר החברה מוצגות כמה הקלטות מסונתזות שנוצרו עם קולותיהם של דונלד טראמפ וברק אובמה.
@realDonaldTrump https://t.co/N6DRPdEGPT pic.twitter.com/G30DvmQNdk
- Lyrebird AI (@LyrebirdAi) 4 בספטמבר 2017
סיפורו של קווין עשוי לעזור לשפוך אור על ההיבטים החיוביים של התעשייה שגבתה את השטח בגלל השימושים הפוטנציאליים והלא אתיים ביישומים שלה. "חשוב שאנשים יבינו את הצד הבהיר של הטכנולוגיה הזו", מזכיר Sotelo של Lyrebird.
מלבד שימושים רפואיים, יישומי סינתיסייזר AI יכולים לשרת מטרות יצרניות אחרות. Voicery מספקת למותגים קולות דיגיטליים המותאמים אישית המופעלים באמצעות אלגוריתמים של AI. גוגל גם מנסה עם WaveNet כדי לספק חוויה טבעית יותר למשתמשים במכשירים המופעלים באמצעות Google Assistant שלה. תחומים אחרים שבהם הטכנולוגיה שימושית כוללים אוטומציה של ספרי שמע או הקלת הדיבוב הקולי בסרטים בהרבה יותר קל.
מכשולים אתיים ומשפטיים ללא ספק יתעוררו והדיונים יימשכו. אבל עבור קווין, AI הוא כוח לתמיד. "אני לא רוצה להישמע כמו מחשב", הוא אומר. "אני רוצה להישמע כמוני."