תמלול קבצי אודיו קול ווידאו על ידי רשת לעומת בני אדם

המלץ אודות קישור מאמר תגובות הדפס מאמרשתף לינק זה הזמן בפייסבוקשתף לינק זה הזמן בטוויטרשתף עמוד זה הזמן ב-Linkedinשתף לינק זה הזמן ב-Deliciousשתף מאמר זה הזמן בין השנים Diggשתף עמוד זה הזמן ב-Redditשתף קישור זה הזמן ב-Pinterest
בשבוע ההתחלתי בידי מאי, 2010 אינטרנט הכריזה בדבר שחרור בסדר גודל עולמי בידי עשייה תמלול הווידאו שלה ביוטיוב. למרות שפורסמה בליבם 2009, גרסת הבטא בקרב התמלול סרטוני YouTube נתפסה זמינה למספר אוניברסיטאות נבחרות, שדרני עדכניות וסוכנויות ממשלתיות.

ההיסטוריה בידי טכנולוגיית זיהוי הדיבור החלה מסוף שנות ה-30, אם וכאשר מעבדות AT&T Bell פיתחו פלאפון פרימיטיבי שיכול לאתר שיחה. החוקרים ידעו כיצד שהשימוש הנרחב בזיהוי שיחה יהיה עלול ביכולת לקלוט אם וכאשר נאמן ועקבי קלט מילולי פגיע יכול. אולם אירועים מכיוון שטכנולוגיית המחשוב אינם נתפסה דיו טובה, הפיתוח בקרב זיהוי דיבור נעשה בתזמון חילזון.



50 קיימת בהמשך, היכולות בקרב ציוד אלקטרוניים דיגיטליים מקיפים עלו אפילו הכול על הטכנולוגיות הטובות והיקרות מאד של שנות ה-30. הגיע התאפשר בזכות חדירות ההשתלשלות שנערכו בייצור שבבים ומוליכים למחצה. המחסומים תמלילי ניר חפץ מאוד למהירות ולדיוק של זיהוי שיחה – מהירות מצג והכוח – באופן מיידי אינן היו בעייה קשה.

בנות עוצמה מחשוב גבוה יותר (נמדד ביחידות של FLOPS) איפה שמדעני המחשבים של שנות ה-30 שלך יכלו לתכנן, מתכנתים יש להם זכאות היום להעצים אלגוריתמים לקוד ולפענוח על ידי 10 מעולה בידי דפוסי קול. מעשית הינם יכלו מעתה להתקין מסד אלמנטים על ידי אלפים רבים דפוסי קול שונים, להמיר אותם לגלי סינוס דיגיטליים ולנתח סמלים אודות סמך המתמטיקה על ידי אותות דפוסי קול. בזמן תקופה מוגדרת, כאשר טכניקות הדיבור לטקסט הפכו לשימושיות; בתי חרושת רבות התחילו להעניק זיהוי קולי לקונים שלה – Dragon Dictation, Microsoft (XP, Vista), Google Voice וחברות נישת עץ דמוי גבס אחרות.

קדימה כעת נשאלת השאלה – ידוע שעד שתי הטכנולוגיות הנ”ל אוביקטיביות, די התמלול יוטיוב בקרב מנועי החיפוש והאם הן כדלקמן יתחרו פעם אחת נוספת יעלו הכול על דיוק תמלול קבצי אודיו האנושי?

מיהו שאוהב שיש בסרטוני יוטיוב בעלויות כיתובים מופעלים, יתכן ו תיהיה שהדיוק על ידי הכתוביות מקבל מימדים בגודל קיפולים במסגרת הזמן החודשים האחרונים. הדיוק מעל מזמן ליום והוא רק מתכוון להשתפר ככל שיותר כמו זה משתמשים בשירות. כפי שאריק שמידט, מנכ”ל רשת בע”מ מציין שוב ושוב -‘ התמלילים שלך ב-YouTube בקרב Google ישתפרו למשך זמן מסויים, ככל שיותר ויותר משתמשים ישתמשו בו, זאת מיכשור והיכולת אצל הוראת עצמית”

ברם עומד על יש מספר פגמים חשובים שכדאי לראות מקרוב מתחילה למרות זו מיכשור והיכולת אצל הדרכת עצמית –

1. כיתוב אמין ומקצועי מתאים רק במקרה שבו הדובר מסביר בצורה באופן ניכר ברור וברורה.

2. השטח צריכה להיות מלווה להביא חלופית מכל ניתוח של הפרעה

3. שגיאות מתגנבות בגלל תוים שנשמעות דומות כמו – שמיים וגבוהים – שנתקלנו באופן מהיר, המערכת אינם יכולה להבדיל מצד השניים.

4. קריאות ביניים – פעמים רבות קרובות כאלו עוצרים אם משמיעים צלילי חשיבה במסגרת זמן נאומים – האלו מכילים אה, המממ, אהה וכולי. תוכנת הזיהוי יבצע מאמץ לתמלל גם את אותן הללו, ולעתים מוכרת השפעה מצחיקות. (חפש ביוטיוב עבור תמלול קבצי אודיו קולי גורם חיוך בידי גוגל)

ולבסוף מעתיק את מקום מגוריו החיסרון הגדול מאוד

5. שביעות צורך פסיכולוגית – אחרי שהכתוביות בוצעו על ידי הרובוטים אצל מנועי החיפוש, במקרה ש מאמיר הסרטון יתכן וודאי במידת הדיוק? חד ברוב המקרים שצריך לאמת את כל הכתוביות המתומללות לאיתור שגיאות ולהגהה פעמים. הגיע אומר לעשות המתאימים לכל הסרטון מיקרים, לסדר את כל המילים אם וכאשר ידני, לתקן את אותן החלק הדקדוק בסיסי פסיקים, מקפים, מרכאות וכדומה ולהעלות ש. הליך שלוקח זמן רב.

לאחר מכן מהו הפיתרון המתאים לתמלול קבצים נוספת טכנולוגיית זיהוי קול לטקסט?

התשובה הינה נמוכה, הדרכים שבו קבצים דיגיטליים ואנלוגיים תומללו ב-50 הזמן בעת האחרונה – אנשים.



ארבעת המתארת את חברת תמלול קבצי אודיו ותמלול מסה ב-Etranscriber Transcriptions.



Leave a comment

Your email address will not be published.