קבלו הרמה להנחתה - על פי דה ברולי:

uzi2 · 6/4/12

אתנסח בצורה יותר מדויקת

הרעש שאמורים לסנן, הוא רעש בעל מאפיינים מסויימים (ביחוד תחום ספקטרלי), אבל הוא לא אחיד. דוגמים אותו בקטעי השקט ומחסירים מקטעי הדיבור. הרעש עם אותם המאפיינים יסונן מקטעי הדיבור, אבל כל החריגות מהאחידות לא יסוננו, וכל תבניות חריגות שהיו ברעש הרקע, יתווספו לקול "המסונן" וזה הרעש המוסיקלי. כאמור - לא מדובר בבעיה שקשורה לקידוד האנלוגי.
האי-דיוק שלי - הוא שרעש הרקע שכן מסונן אינו רק רעש לבן.

פולספגן · 6/4/12

יש לך מס' טעויות -

1) רעש שאינו לבן נקרא רעש צבעוני במקרה המדובר ולא רעש מוסיקלי שאופייני לקיטעי שקט בעיקר.

2) כן, מדובר על קידוד אנאלוגי, כי אתה לוקח אות אנאלוגי עושה לו התמרה בתדר ע"י FFT, מעלה אותו בריבוע בערך מוחלט וסוכם את כל צפיפויות ההספק.
לפני שאתה מעלה בריבוע, אתה שומר את הפאזה עם השוני ב-90 מעלות.
עכשיו נותר לך להפעיל למשל MSE ולהחליט ע"י סף מה רעש או מה לא ע"י החסרה.
בגמר התהליך, נשאר לך להוציא שורש, להחזיר את הזווית ולבצע IFFT.
כפי שבטח שמת לב מההסבר שלי, לא עסקת כאן בבדידים.

קומרן · 7/4/12

את בטוחה שלא תיארת כאן קידוד דיגיטלי?

כי לפי ההסבר שלך זה דיגיטלי..

פולספגן · 7/4/12

בדיגיטלי אתה משתמש בהתמרת Z ולא בפוריה

קומרן · 7/4/12

אני לא מהתחום , אבל

כשאת נותנת למחשב לעשות כל מיני קונצים מטמתיים לאות אנאלוגי מסויים , את לא חייבת קודם כל להמירו לאות דיגיטלי?

אני לא ממש מיודע מה זו התמרת Z או פוריה כי אני לא מהנדס אלקטרוניקה או מתחום קרוב , אבל זה נשמע לי לא יותר מהגיוני...

uzi2 · 7/4/12

בדיגיטלי

מכיוון שהאות מקוונטט, אז בעצם, טרנספורם פורייה לא יכול להיות רציף. בגלל זה עושים לפעמים טרנספורם-Z (שהוא על המרחב הבדיד) כאשר מגדירים את Z כפאזה, שלמעשה זו צורת הסתכלות על הדברים. זו לא הדרך היחידה. FFT הוא אלגוריתם (ליתר דיוק משפחה של אלגוריתמים) לביצוע טרנספורם פוריה, ואם תסתכלי על האלגוריתמים השונים תראי את הקירבה בין זה ובין טרנספורם-Z.

פולספגן · 7/4/12

ברור שיש קירבה -

היא מהווה הכללה של פיתוח לטורי פורייה המרוכבים לכל המישור המרוכב ולא רק למעגל היחידה.

אגב, למעשה זוהי ההתמרה המקבילה להתמרת לפלס הפועלת על אותות רציפים.

uzi2 · 7/4/12

ממש לא.

1. רעש שאינו לבן, נקרא אכן רעש צבעוני. בזה צדקת (אם כי זה נכון באופן כללי), אך זה לא סותר את דברי. הרעש המוסיקלי שמופיע בקטעי הקול, נובע מהפערים בתבניות בין קטעי השקט לקטע הרעש. כך שבמקרה הזה העובדה שהרעש הוא צבעוני ולא לבן, מוביל ליצירת הרעש המוסיקלי.
2. FFT הוא אלגוריתם, קרי הנחיות לכתיבת קוד תוכנה. לכן מבצעים FFT על ידי תוכנה, ולכן מדובר בקלט ופלט דיגיטלים.
3. יש לך עוד טעויות: לא סוכמים על צפיפויות ההספק, אלא על צפיפות אות ליח' תדירות. זה הבדל משמעותי, כי הספק הולך לפי הריבוע של האות, ויש הבדל בין קודם לסכום ואח"כ להעלות בריבוע, ולהיפך.
4. על איזו פאזה של 90 מעלות את מדברת. אין שום אזכור לזה ב- SSS, וגם לא רואה שום הגיון בזה. יש החסרה, ששקולה לחיבור + הזזת פאזה של 180 מעלות.

אעצור כאן.

פולספגן · 7/4/12

שמת לב שלא סתרת אותי בכלום.

מסכימה עם מה שכתבת בס'1.
FFT זוהי התמרת פוריה מהירה שהינו אלגוריתם יעיל לחישוב DFT כאשר כמובן מדובר על רצף סופי של מס' מתחום הממשי או המורכב.
ההבדל ביניהם הוא בסה"כ בעיגול השגיאה.

לגבי ס'3, קראת את מה שכתבתי?
(כתבתי שהסכימה על הריבוע של האות)

לגבי ס'4, ההזזה באלגוריתם שכתבתי לך היא ב-90 ולא ב-180 כפי שכתוב ב-SSS.
מה שעשיתי כאן הוא בסה"כ שלקחתי את האלגוריתם המוצע במאמר (ראה ב-Fig1) וקצצתי אותו לשם נוחות ההסבר.

uzi2 · 7/4/12

ברגע שזה אלגוריתם ממוחשב זה אומר

זה אומר שהעיבוד הוא על הייצוג הדיגיטלי של האות, ולא על האנלוגי!
אות חייב להיות מומר לייצוג דיגיטלי על מנת שתוכנת מחשב תוכל להריץ עליו FFT.
שנית, לא רואה שום איזכור של הזזה ב- 90 מעלות במאמר וגם לא ב- figure 1.

מה שנכון. הסכימה היא על הריבוע ואז באמת היא על צפיות ההספק.

פולספגן · 7/4/12

ההזזה של ה-90 במקום 180 היא בגלל שקצצתי

חלקים באלגוריתם המוצע שם.
יהיה לך יותר נוח להבין אם אצייר לך?

uzi2 · 7/4/12

אין לי בעיה להבין את האלגוריתם.

יש לי אותו במלואו מצויר. אין צורך שתציירי לי אותו. אנא הצביעי איפה שם דובר על הזזה של האות ב- 90 מעלות ולאחר מכן החזרה שלו.

יש עניין אחר, ואולי את מתכוונת אליו, (אבל אז לא התנסחת בדייקנות) החסרה של פאזה של 180 מעלות מהריבוע, שקולה להחסרה של 90 מעלות מהמקור, אבל החסרה של 180 מעלות יש רק לאחד האותות ואין אח"כ החזרה של הפאזה. וגם אז ההזזה (שלפי איור 1 שעליו דיברת) מתרחשת לצורך החסרת האות. מתבצעת מהריבוע, ולכן היא של 180.

בכל מקרה, אני מקווה שאנחנו כבר מסכימים שמדובר לא בחסרון הגדול של הקידוד האנלוגי, אלא בחסרון של פרוצדורה נפוצה של הגברת אות דיבור (יחסית לרקע) שפועלת דווקא בקידוד הדיגיטלי.

פולספגן · 8/4/12

אתה בטוח שאתה לא צריך שאצייר אותו?

בתגובתי הקודמת כבר הערתי לך שכתבתי שהסכימה על הריבוע של האות ואתה הבנת אחרת.
כעת כאן שוב אתה עושה את זה, כי כתבתי שהשמירה של ה-90 מעלות היא בין ה-FFT ל-IFFT (לאחר הוצאת השורש) ואתה כותב שלא התנסחתי בדייקנות.

uzi2 · 8/4/12

אני בטוח. הדיאגרמה ברורה לי.

א. קיבלתי את דברייך לגבי הריבוע, כפי שציינתי קודם. פשוט לא הגעתי אל הדיאגרמה בפוסט הראשון שלי. אז כאן טעיתי ותיקנתי את עצמי.

ב. כתבת גם "להחזיר את הזווית" האם התכוונת להחזרת הסימן (פלוס או מינוס) שכן הסימן נמחק בהעלאה בריבוע, אז אני מקבל, אבל פשוט בגלל שכתבת שמירה של הזווית של 90 מעלות, הנחתי שאת מדברת על זה כלומר על עניין הפאזה של ה- 90 מעלות (לא נהוג להגדיר כזווית, החזרת סימן למרות שניתן לתאר זאת גם כך). יכול להיות שאני עדיין לא מבין למה התכוונת כשכתבת "שמירה של ה- 90 מעלות", אנא נסחי שוב את מה שכתבת, בצורה יותר מפורטת (למשל 90 מעלות בין מה למה). את הדיאגרמה אני מבין.

ג. מכיוון שהפוסט התחיל מעניין החסרונות של האנלוגי, אני מניח מכך שלא התייחסת לכך שאת לפחות מסכימה, שלא מדובר בחסרון של קידוד אנלוגי.

פולספגן · 8/4/12

שוב -

מתגובתי הקודמת:- "כתבתי שהשמירה של ה-90 מעלות היא בין ה-FFT ל-IFFT (לאחר הוצאת השורש)"

אם אתה מתעקש שלא אצייר ובכל זאת מבקש שאנסח טוב יותר אז אסביר במילים את דיאגרמת המלבנים, כדלקמן:-
הדיאגרמה בנויה בצורת אינסוף (8 שוכב), כאשר בחלק העליון יש לך את ה-FFT ומימינו את 2^|FFT|.
בחלק התחתון יש את השורש מצד ימין ומשמאל את ה-IFFT.
בעמודים האנכיים יש מצד ימין את ה-MSE ובאמצע את השמירה של הפאזה של 90 מעלות, קרי ביציאה בין השורש לכניסה של ה-IFFT.

לגבי ג', אכן מסכימה, שטעיתי ומדובר בעיבוד אותות ספרתי.

uzi2 · 9/4/12

הבנתי את כוונתך. אז ככה

העמודה הימנית ביותר היא לא MSE (Mean squared error) אלא פשוט משהו שמאפס את ריבוע המקדמים אם הם שליליים (המקדמים של הגלים ההרמוניים). לא יכול להיות שכאשר מחסירים את הרעש מהאות עם הרעש, נקבל צפיפויות הספק שליליים, מה גם שאם זה יוצא שלילי, השורש של ריבוע המקדם יצא מדומה, ונקבל קישקוש מבחינה פיסיקלית, לכן מאפסים את ריבועי המקדמים השליליים. אח"כ יש לנו את הוצאת השורש, שדיברת עליה. אח"כ יש לנו החזרה של הסימן של המקדם. צריך לזכור כי כאשר העלנו את המקדם בריבוע, איבדנו את המידע לגבי הסימן שלו, ועלינו להחזיר את הסימן של המקדם לאחר החסרת הרעש ונוצאת השורש. השמירה, אם כן, היא לא של ה- 90 מעלות, אלא של הסימן של המקדם. וההחזרה כנ"ל (סימן ולא 90 מעלות). החזרת סימן פירושה שכאשר הסימן שונה מחליפים אותו, ובמקרה כזה זה שקול להזזה ב- 180 מעלות.

להלן (עבור כל מי שקורא אך איבד את ההקשר ולא יודע על איזו דיאגרמה אנחנו מדברים) המאמר. אנו מדברים על תמונה 1 במאמר.

פולספגן · 9/4/12

לא תקבל מקדמים שליליים כי אתה בערך מוחלט

לכן, אתה לא צריך לאפס שום מקדמים.

אגב, להזכירך, האלגוריתם הזה הוא למציאת קיטעי שקט ולכן רק שם תעבור את הסף שהצבת.

למה אתה טוען שהסימן שקול ל-180 מעלות ולא ל-90 מעלות?

uzi2 · 9/4/12

תשובה

אם אני מחליף סימן לערך מסוים פעמיים הערך חוזר לעצמו. גם הזזת פאזה ב- 180 מעלות פעמיים נותנת פאזה של 360 מעלות (מחזור שלם), שמחזירה את הערך לעצמו. זה לא המצב אם החלפת סימן היתה שקולה להזזה ב- 90 מעלות, ואז היינו צריכים לבצע 4 פעמים "החלפת סימן" כדי לחזור לאותו הערך.

צפיפות הספק הרעש וצפיפות הספק המקור חיוביים, אך החיסור של הרעש מהמקור יכולבמקרים מסוימים לתת בפועל ערכים שליליים (בשל חוסר אחידות בתבניות הרעש).

האלגוריתם הוא לא למציאת קטעי שקט אלא להסרת רעש הרקע, כאשר דוגמים את רעש הרקע בקטעים שבהם אין דיבור [1]. ה- FFT של רעש הרקע הוא S_v שבשרטוט, והערך המוחלט של הריבוע שלו, מוחסר מהערך המוחלט של הריבוע של המקור. ההחסרה יכולה להיות שלילית.

[1] ציטוט מהמאמר:
(2) Subtraction of the estimate of the power spectral density of the noise, which is normally estimated from a portion of the noisy signal during which speech is
absent;
(3) Half-wave rectification: the negative result of
subtracting is replaced by zero;"

uzi2 · 9/4/12

תיקון

למעשה התיקון הוא לא להודעה האחרונה שלי, אלא לזו שלפניה.

בפועל אחרי הוצאת שורש יש לא החזרת סימן, אלא החזרת פאזה (המקורית) לא קשור ל- 90 מעלות, אך גם לא חייב להיות 180 מעלות. האמת שמה שכתבתי היה תקף אילו ה- FFT בדוגמה שלהם לא היה עובד עם פאזורים אלא עם סינוס וקוסינוס (וזה נכון מבחינה מתמטית ולמעשה אין בעיה לעבוד כך), אבל במקרה של המאמר המדובר ה- FFT עובד עם פאזורים, ולכן לא מדובר בסימן גרידא, אלא בפאזה.

קבלו הרמה להנחתה - על פי דה ברולי:

uzi2

Active member

פולספגן

New member

קומרן

New member

פולספגן

New member

קומרן

New member

uzi2

Active member

פולספגן

New member

uzi2

Active member

פולספגן

New member

uzi2

Active member

פולספגן

New member

uzi2

Active member

פולספגן

New member

uzi2

Active member

פולספגן

New member

uzi2

Active member

פולספגן

New member

uzi2

Active member

uzi2

Active member