http://mila.cs.technion.ac.il/corpora/a7corpus/ בחלק שמדבר על סטטיסטיקה יש מידע כזה המבוסס על כתבות של ערוץ 7 מאז 2001. צריך רק להבין שהטקסט מתרכז בעיקר באוצר מילים שאפייני למדיום. אם תנתן לי גישה לטקסטים מסוגות אחרות וכן רשות לבצע את החישוב (אני לא מעוניין להפר זכויות יוצרים) אשמח לפרסם באתר (בחינם) תוצאות מקיפות יותר.