קבלו הרמה להנחתה - על פי דה ברולי:

uzi2

Active member
אתנסח בצורה יותר מדויקת

הרעש שאמורים לסנן, הוא רעש בעל מאפיינים מסויימים (ביחוד תחום ספקטרלי), אבל הוא לא אחיד. דוגמים אותו בקטעי השקט ומחסירים מקטעי הדיבור. הרעש עם אותם המאפיינים יסונן מקטעי הדיבור, אבל כל החריגות מהאחידות לא יסוננו, וכל תבניות חריגות שהיו ברעש הרקע, יתווספו לקול "המסונן" וזה הרעש המוסיקלי. כאמור - לא מדובר בבעיה שקשורה לקידוד האנלוגי.
האי-דיוק שלי - הוא שרעש הרקע שכן מסונן אינו רק רעש לבן.
 

פולספגן

New member
יש לך מס' טעויות -

1) רעש שאינו לבן נקרא רעש צבעוני במקרה המדובר ולא רעש מוסיקלי שאופייני לקיטעי שקט בעיקר.

2) כן, מדובר על קידוד אנאלוגי, כי אתה לוקח אות אנאלוגי עושה לו התמרה בתדר ע"י FFT, מעלה אותו בריבוע בערך מוחלט וסוכם את כל צפיפויות ההספק.
לפני שאתה מעלה בריבוע, אתה שומר את הפאזה עם השוני ב-90 מעלות.
עכשיו נותר לך להפעיל למשל MSE ולהחליט ע"י סף מה רעש או מה לא ע"י החסרה.
בגמר התהליך, נשאר לך להוציא שורש, להחזיר את הזווית ולבצע IFFT.
כפי שבטח שמת לב מההסבר שלי, לא עסקת כאן בבדידים.
 

קומרן

New member
את בטוחה שלא תיארת כאן קידוד דיגיטלי?

כי לפי ההסבר שלך זה דיגיטלי..
 

קומרן

New member
אני לא מהתחום , אבל

כשאת נותנת למחשב לעשות כל מיני קונצים מטמתיים לאות אנאלוגי מסויים , את לא חייבת קודם כל להמירו לאות דיגיטלי?

אני לא ממש מיודע מה זו התמרת Z או פוריה כי אני לא מהנדס אלקטרוניקה או מתחום קרוב , אבל זה נשמע לי לא יותר מהגיוני...
 

uzi2

Active member
בדיגיטלי

מכיוון שהאות מקוונטט, אז בעצם, טרנספורם פורייה לא יכול להיות רציף. בגלל זה עושים לפעמים טרנספורם-Z (שהוא על המרחב הבדיד) כאשר מגדירים את Z כפאזה, שלמעשה זו צורת הסתכלות על הדברים. זו לא הדרך היחידה. FFT הוא אלגוריתם (ליתר דיוק משפחה של אלגוריתמים) לביצוע טרנספורם פוריה, ואם תסתכלי על האלגוריתמים השונים תראי את הקירבה בין זה ובין טרנספורם-Z.
 

פולספגן

New member
ברור שיש קירבה -

היא מהווה הכללה של פיתוח לטורי פורייה המרוכבים לכל המישור המרוכב ולא רק למעגל היחידה.

אגב, למעשה זוהי ההתמרה המקבילה להתמרת לפלס הפועלת על אותות רציפים.
 

uzi2

Active member
ממש לא.

1. רעש שאינו לבן, נקרא אכן רעש צבעוני. בזה צדקת (אם כי זה נכון באופן כללי), אך זה לא סותר את דברי. הרעש המוסיקלי שמופיע בקטעי הקול, נובע מהפערים בתבניות בין קטעי השקט לקטע הרעש. כך שבמקרה הזה העובדה שהרעש הוא צבעוני ולא לבן, מוביל ליצירת הרעש המוסיקלי.
2. FFT הוא אלגוריתם, קרי הנחיות לכתיבת קוד תוכנה. לכן מבצעים FFT על ידי תוכנה, ולכן מדובר בקלט ופלט דיגיטלים.
3. יש לך עוד טעויות: לא סוכמים על צפיפויות ההספק, אלא על צפיפות אות ליח' תדירות. זה הבדל משמעותי, כי הספק הולך לפי הריבוע של האות, ויש הבדל בין קודם לסכום ואח"כ להעלות בריבוע, ולהיפך.
4. על איזו פאזה של 90 מעלות את מדברת. אין שום אזכור לזה ב- SSS, וגם לא רואה שום הגיון בזה. יש החסרה, ששקולה לחיבור + הזזת פאזה של 180 מעלות.

אעצור כאן.
 

פולספגן

New member
שמת לב שלא סתרת אותי בכלום.

מסכימה עם מה שכתבת בס'1.
FFT זוהי התמרת פוריה מהירה שהינו אלגוריתם יעיל לחישוב DFT כאשר כמובן מדובר על רצף סופי של מס' מתחום הממשי או המורכב.
ההבדל ביניהם הוא בסה"כ בעיגול השגיאה.

לגבי ס'3, קראת את מה שכתבתי?
(כתבתי שהסכימה על הריבוע של האות)

לגבי ס'4, ההזזה באלגוריתם שכתבתי לך היא ב-90 ולא ב-180 כפי שכתוב ב-SSS.
מה שעשיתי כאן הוא בסה"כ שלקחתי את האלגוריתם המוצע במאמר (ראה ב-Fig1) וקצצתי אותו לשם נוחות ההסבר.
 

uzi2

Active member
ברגע שזה אלגוריתם ממוחשב זה אומר

זה אומר שהעיבוד הוא על הייצוג הדיגיטלי של האות, ולא על האנלוגי!
אות חייב להיות מומר לייצוג דיגיטלי על מנת שתוכנת מחשב תוכל להריץ עליו FFT.
שנית, לא רואה שום איזכור של הזזה ב- 90 מעלות במאמר וגם לא ב- figure 1.

מה שנכון. הסכימה היא על הריבוע ואז באמת היא על צפיות ההספק.
 

פולספגן

New member
ההזזה של ה-90 במקום 180 היא בגלל שקצצתי

חלקים באלגוריתם המוצע שם.
יהיה לך יותר נוח להבין אם אצייר לך?
 

uzi2

Active member
אין לי בעיה להבין את האלגוריתם.

יש לי אותו במלואו מצויר. אין צורך שתציירי לי אותו. אנא הצביעי איפה שם דובר על הזזה של האות ב- 90 מעלות ולאחר מכן החזרה שלו.

יש עניין אחר, ואולי את מתכוונת אליו, (אבל אז לא התנסחת בדייקנות) החסרה של פאזה של 180 מעלות מהריבוע, שקולה להחסרה של 90 מעלות מהמקור, אבל החסרה של 180 מעלות יש רק לאחד האותות ואין אח"כ החזרה של הפאזה. וגם אז ההזזה (שלפי איור 1 שעליו דיברת) מתרחשת לצורך החסרת האות. מתבצעת מהריבוע, ולכן היא של 180.

בכל מקרה, אני מקווה שאנחנו כבר מסכימים שמדובר לא בחסרון הגדול של הקידוד האנלוגי, אלא בחסרון של פרוצדורה נפוצה של הגברת אות דיבור (יחסית לרקע) שפועלת דווקא בקידוד הדיגיטלי.
 

פולספגן

New member
אתה בטוח שאתה לא צריך שאצייר אותו?

בתגובתי הקודמת כבר הערתי לך שכתבתי שהסכימה על הריבוע של האות ואתה הבנת אחרת.
כעת כאן שוב אתה עושה את זה, כי כתבתי שהשמירה של ה-90 מעלות היא בין ה-FFT ל-IFFT (לאחר הוצאת השורש) ואתה כותב שלא התנסחתי בדייקנות.
 

uzi2

Active member
אני בטוח. הדיאגרמה ברורה לי.

א. קיבלתי את דברייך לגבי הריבוע, כפי שציינתי קודם. פשוט לא הגעתי אל הדיאגרמה בפוסט הראשון שלי. אז כאן טעיתי ותיקנתי את עצמי.

ב. כתבת גם "להחזיר את הזווית" האם התכוונת להחזרת הסימן (פלוס או מינוס) שכן הסימן נמחק בהעלאה בריבוע, אז אני מקבל, אבל פשוט בגלל שכתבת שמירה של הזווית של 90 מעלות, הנחתי שאת מדברת על זה כלומר על עניין הפאזה של ה- 90 מעלות (לא נהוג להגדיר כזווית, החזרת סימן למרות שניתן לתאר זאת גם כך). יכול להיות שאני עדיין לא מבין למה התכוונת כשכתבת "שמירה של ה- 90 מעלות", אנא נסחי שוב את מה שכתבת, בצורה יותר מפורטת (למשל 90 מעלות בין מה למה). את הדיאגרמה אני מבין.

ג. מכיוון שהפוסט התחיל מעניין החסרונות של האנלוגי, אני מניח מכך שלא התייחסת לכך שאת לפחות מסכימה, שלא מדובר בחסרון של קידוד אנלוגי.
 

פולספגן

New member
שוב -

מתגובתי הקודמת:- "כתבתי שהשמירה של ה-90 מעלות היא בין ה-FFT ל-IFFT (לאחר הוצאת השורש)"

אם אתה מתעקש שלא אצייר ובכל זאת מבקש שאנסח טוב יותר אז אסביר במילים את דיאגרמת המלבנים, כדלקמן:-
הדיאגרמה בנויה בצורת אינסוף (8 שוכב), כאשר בחלק העליון יש לך את ה-FFT ומימינו את 2^|FFT|.
בחלק התחתון יש את השורש מצד ימין ומשמאל את ה-IFFT.
בעמודים האנכיים יש מצד ימין את ה-MSE ובאמצע את השמירה של הפאזה של 90 מעלות, קרי ביציאה בין השורש לכניסה של ה-IFFT.

לגבי ג', אכן מסכימה, שטעיתי ומדובר בעיבוד אותות ספרתי.
 

uzi2

Active member
הבנתי את כוונתך. אז ככה

העמודה הימנית ביותר היא לא MSE (Mean squared error) אלא פשוט משהו שמאפס את ריבוע המקדמים אם הם שליליים (המקדמים של הגלים ההרמוניים). לא יכול להיות שכאשר מחסירים את הרעש מהאות עם הרעש, נקבל צפיפויות הספק שליליים, מה גם שאם זה יוצא שלילי, השורש של ריבוע המקדם יצא מדומה, ונקבל קישקוש מבחינה פיסיקלית, לכן מאפסים את ריבועי המקדמים השליליים. אח"כ יש לנו את הוצאת השורש, שדיברת עליה. אח"כ יש לנו החזרה של הסימן של המקדם. צריך לזכור כי כאשר העלנו את המקדם בריבוע, איבדנו את המידע לגבי הסימן שלו, ועלינו להחזיר את הסימן של המקדם לאחר החסרת הרעש ונוצאת השורש. השמירה, אם כן, היא לא של ה- 90 מעלות, אלא של הסימן של המקדם. וההחזרה כנ"ל (סימן ולא 90 מעלות). החזרת סימן פירושה שכאשר הסימן שונה מחליפים אותו, ובמקרה כזה זה שקול להזזה ב- 180 מעלות.

להלן (עבור כל מי שקורא אך איבד את ההקשר ולא יודע על איזו דיאגרמה אנחנו מדברים) המאמר. אנו מדברים על תמונה 1 במאמר.
 

פולספגן

New member
לא תקבל מקדמים שליליים כי אתה בערך מוחלט

לכן, אתה לא צריך לאפס שום מקדמים.

אגב, להזכירך, האלגוריתם הזה הוא למציאת קיטעי שקט ולכן רק שם תעבור את הסף שהצבת.

למה אתה טוען שהסימן שקול ל-180 מעלות ולא ל-90 מעלות?
 

uzi2

Active member
תשובה

אם אני מחליף סימן לערך מסוים פעמיים הערך חוזר לעצמו. גם הזזת פאזה ב- 180 מעלות פעמיים נותנת פאזה של 360 מעלות (מחזור שלם), שמחזירה את הערך לעצמו. זה לא המצב אם החלפת סימן היתה שקולה להזזה ב- 90 מעלות, ואז היינו צריכים לבצע 4 פעמים "החלפת סימן" כדי לחזור לאותו הערך.

צפיפות הספק הרעש וצפיפות הספק המקור חיוביים, אך החיסור של הרעש מהמקור יכולבמקרים מסוימים לתת בפועל ערכים שליליים (בשל חוסר אחידות בתבניות הרעש).

האלגוריתם הוא לא למציאת קטעי שקט אלא להסרת רעש הרקע, כאשר דוגמים את רעש הרקע בקטעים שבהם אין דיבור [1]. ה- FFT של רעש הרקע הוא S_v שבשרטוט, והערך המוחלט של הריבוע שלו, מוחסר מהערך המוחלט של הריבוע של המקור. ההחסרה יכולה להיות שלילית.

[1] ציטוט מהמאמר:
(2) Subtraction of the estimate of the power spectral density of the noise, which is normally estimated from a portion of the noisy signal during which speech is
absent;
(3) Half-wave rectification: the negative result of
subtracting is replaced by zero;"
 

uzi2

Active member
תיקון

למעשה התיקון הוא לא להודעה האחרונה שלי, אלא לזו שלפניה.

בפועל אחרי הוצאת שורש יש לא החזרת סימן, אלא החזרת פאזה (המקורית) לא קשור ל- 90 מעלות, אך גם לא חייב להיות 180 מעלות. האמת שמה שכתבתי היה תקף אילו ה- FFT בדוגמה שלהם לא היה עובד עם פאזורים אלא עם סינוס וקוסינוס (וזה נכון מבחינה מתמטית ולמעשה אין בעיה לעבוד כך), אבל במקרה של המאמר המדובר ה- FFT עובד עם פאזורים, ולכן לא מדובר בסימן גרידא, אלא בפאזה.
 
למעלה