Цифры и факты
|
Цифры и факты
Как собирать цифры и факты: - использовать газеты/Интернет - использовать библиотеки/подшивки газет - брать интервью ключевых фигур - проверять и перепроверять Как писать о собранных вами фактах и цифрах: - попытаться нарисовать графики - попытаться упорядочить все в таблицы, списки - давать только самые важные факты и цифры - при необходимости, давать мнение обеих сторон
Статистика и статистические данные
Среднее арифметическое Это один из наиболее распространенных видов статистики, с которым вы сталкиваетесь. И его легко рассчитывать. Надо просто сложить все цифры в полученных данных и разделить полученную сумму на количество показателей. Например: предположим, вы пишите о корпорации «Всемирная финтифлюшка» и о заработках девяти ее работников. Генеральный директор зарабатывает 100000 долларов в год, два менеджера – 50000 долларов в год, четыре рабочих фабрики по 15000 долларов каждый, а два ученика – 9000 долларов в год. Складываете $100,000 + $50,000 + $50,000 + $15,000 + $15,000 + $15,000 + $15,000 + $9,000 + $9,000 (все показатели в полученных данных), что дает вам 278000 долларов. Делите общую сумму на 9 (число показателей в полученной информации). Это дает среднее арифметическое, равное 30889 долларов. Неплохая средняя зарплата. Но используйте эту цифру осторожно. В конце концов, лишь три работника корпорации имеют такую зарплату. А остальные шестеро и до половины средней зарплаты не дотягивают. Так какую же статистику надо использовать, чтобы дать какое-либо представление о том, сколько зарабатывает средний работник в этой корпорации? Пришло время узнать о: Срединном значении Как только вы пишите слова «средний работник» это или «средняя семья» то, не надо использовать среднее арифметическое для такой ситуации. Вам необходима статистика, говорящая что-то о работнике или семье, находящейся посередине. Это срединное значение. И здесь легко посчитать статистику, потому что здесь речь идет о том значении, что находится посередине. Выстройте показатели в ваших данных от самого низкого до самого высокого. Тот, который окажется в самой середине и есть ваше срединное значение. Для корпорации «Всемирная финтифлюшка» мы имеем следующие показатели зарплаты: Девять работников. Ровно посередине списка на пятом месте находится значение 15000 долларов. Это срединное значение. (Если середина оказывается между двумя значениями – выведите из них среднее). Если сравнить среднее арифметическое со срединным значением, вы увидите, насколько далеко друг от друга находятся показатели в полученной информации. В данном случае мы наблюдаем довольно большой разрыв между генеральным директором «Всемирной финтифлюшки» и простыми работниками. (В реальном мире, конечно, набора всего из девяти чисел будет недостаточно, чтобы рассказать хоть о чем-нибудь. Но в данном случае мы просто даем пример, чтобы разъяснить концепцию.) У статистиков имеется значение, называемое стандартным отклонением, говорящее, насколько разделены показатели друг от друга. Большое стандартное отклонение говорит, что данные довольно разбросаны, а маленькое, что данные подобраны весьма близко друг к другу. Так что если вы собираетесь много работать с цифрами или научными исследованиями, то будет полезно узнать немного о Стандартном отклонении Будем честны. Стандартное отклонение более сложная концепция чем те, которые мы уже рассмотрели. И если только вы не пишите для специалистов и профессионалов, то вы, возможно, никогда не используете словосочетание «стандартное отклонение» в статье. Но это не значит, что концепцию можно игнорировать. Стандартное отклонение – это «среднее среднего» и часто может помочь вам увидеть за данными статью. Чтобы понять эту концепцию необходимо понять то, что статистики называют нормальным распределением данных. Нормальное распределение данных значит, что большинство примеров в информации близки к «среднему» и лишь немногие примеры стремятся к одной или другой крайности. Предположим, вы пишите статью о питании. Вам необходимо рассмотреть типичное ежедневное потребление калорий человеком. Как большинство данных, числа типичного потребления человека окажутся распределенными нормально. То есть для большинства людей потребление будет близким к среднему, а некоторые люди будут потреблять намного больше или намного меньше среднего. Если задуматься, то это обычный здравый смысл. Не так много людей живут на диете из морской капуты и риса. Или восемь раз в день едят бифштексы, запивая их молочными коктейлями. Большинство людей где-то посередине. Стандартное отклонение – это статистика, говорящая вам, насколько тесно вокруг среднего арифметического оказались различные примеры в той или иной информации. Когда примеры оказываются рядом довольно тесно и график нормального распределения довольно крутой, то стандартное отклонение небольшое. Когда примеры разбросаны широко и график нормального распределения относительно горизонтален, то значит, что у вас относительно большое стандартное отклонение. Теперь вам необходимо понять элементарную концепцию Процента Изменения в процентах полезны для того, чтобы помочь людям понять изменения за определенный период времени. И опять, для того, чтобы посчитать процент требуется знание математики на уровне третьего класса. Просто отнимите старое значение из нового, потом разделите на старое значение. Результат умножьте на 100 и шлепните рядом знак %. Вот и изменение в процентах. Предположим в Спрингфилде в прошлом году произошло 50 убийств, как и в Кэпитал-Сити. Так что нет никакой разницы в уровне преступности, так? Может нет, а, может, и есть. Давайте вернемся и посмотрим на число убийств в этих городах в предыдущие годы, чтобы мы смогли определить процентное изменение. Пять лет назад в Кэпитал-Сити произошло 42 убийства, а в Спрингфилде всего 29. Отнимите старое значение от нового для каждого города и разделите на старое значение. Это покажет, что за пять лет в Кэпитал-Сити число убийств выросло на 19 процентов, а в Спрингфилде более чем на 72 процента. Вот от чего надо плясать. На душу населения Процент дает вам только часть картины, когда вы сравниваете значения для нескольких сообществ или групп. Еще одна важная статистика – это значение на душу населения для каждой группы. Эти цифры помогают вам сравнить значения для групп различных по своему размеру. Вернемся к Спрингфилду и Кэпитал-Сити. В этом году население Спрингфилда составляло 800000 человек, а население Кэпитал-Сити 600000. Однако пять лет назад в Спрингфилде жило всего 450000 человек, а в Кэпитал-Сити 550000. Почему это важно? Тот факт, что за последние пять лет Спрингфилд вырос гораздо больше, чем Кэпитал-Сити может объяснить, почему за тот же период число убийств в этом городе так увеличилось. В конце концов, если в городе живет больше людей, можно ожидать большего количества убийств. Чтобы определить, действительно ли один из этих городов опаснее другого, вам необходимо определить уровень убийств на душу населения. То есть количество убийств на каждого жителя города. Чтобы определить этот уровень, просто разделите число убийств на число жителей города. Чтобы избежать использования крохотной десятичной дроби, статистики обычно умножают результат на 100000 и дают полученное как число убийств на 100000 человек. В случае Спрингфилда 50 убийств разделенные на 800000 человек дают уровень убийств 6,25 на 100000 человек. 50 убийств Кэпитал-Сити разделенные на 600000 человек дают уровень убийств 8.33 на 100000 человек. Пять лет назад 29 убийств в Спрингфилде, разделенные на 450000 человек дали уровень убийств 6,44 на 100000 человек. А 42 убийства Кэпитал-Сити, разделенные на 550000 человек дали уровень убийств 7,64 на 100000 человек. В процентах мы обнаружили, что число убийств в Спрингфилде выросло за пять лет на 72 процента, а число убийств в Кэпитал-Сити – всего на 19 процентов. Но если теперь сравнить число убийств на душу населения, то уровень убийств в Спрингфилде снизился почти на 3 процента, а уровень убийств на душу населения в Кэпитал-Сити вырос более чем на 9 процентов. Вот мы и имеем реальную историю… Или нет? Когда мы подсчитываем процентное изменение, надо принимать во внимание что-то еще. Чтобы узнать это, посмотрите на цифры на душу населения. Обратитесь за советом к профессионалу Поздравляю! Большинство журналистов даже не догадывается, что для различных ситуаций есть различные типы подсчета и различные данные. Вот вам лучший совет, который я могу дать: поговорите с профессионалом. Вы знаете как хороший редактор может найти синтаксические и другие ошибки в тексте, которые редко замечают даже опытные писатели? Профессиональные статистики тоже самое делают с цифрами. Умный репортер отдают статью редактору до того как передать ее в печать. Почему бы тогда не прогнать полученные вами данные через статистика перед их публикацией? К сожалению я не знаю много газет, которые бы имели в редакции людей с дипломом статистика. Возможно, наши начальники не чувствуют, насколько важны правильные цифры и хороший анализ, но это чувствуют наши читатели. И все лопухания, вызванные нашим коллективным невниманием к таким вещам как статистика, могут быть одной из причин того, почему так много американских газет теряют читателей. Позвоните в отдел связей с общественностью местного колледжа или университета и попросите соединить вас с отделом статистики. Потом поговорите со специалистом о том, что у вас есть и что вы хотите сделать. Как с любым источником здесь лучше установить отношения, не зависящие от сроков, чтобы вы имели время задать вопросы и послушать развернутые ответы. Вы же не будете покупать автомобиль или дом, не задав о нем предварительно несколько вопросов. Поэтому не покупайте чью-либо информацию, не задавая вопросы. Вот несколько стандартных вопросов, которые вы должны задать любому человеку, котрый плюхает вам на стол гору информации и просит об этом написать. 1. Откуда эта информация? Всегда задавайте этот вопрос первым. Вам необходимо знать, кто проводил исследование, в результате которого и появились данные, о которых вы собираетесь писать. Вы удивитесь, но иногда оказывается, что человек, дающий вам кучу цифр, не может сказать, откуда они взялись. Это должно быть для вас первым намеком на то, что надо очень скептически относиться к тому, что вам говорят. Даже если полученная информация происходит из источника, который можно проверить, вы хотите знать, что же это. Вы можете захотеть задать несколько дополнительных вопросов о медицинском исследовании, касающемся последствий пассивного курения, если узнаете, что исследование проводили специалисты, нанятые табачной компанией, а не, к примеру, исследовательской группой известного медицинского университета. Или если вам известно, что исследование по безопасности воды было получено от политической группы, лоббирующей Конгресс по вопросу запрета пестицидов. Но сам факт, что информация исходит от группы, представляющей определенные интересы, не означает, что она лживая. Но вы должны с особым скептицизмом относиться к исследованию, сделанному людьми, имеющими ярко выраженные политические взгляды. Они скорее будут иметь множество причин НЕ рассказать вам о том, что было обнаружено, чем пойти вразрез с линией их партии. 2. Была ли информация проверена такими же специалистами? Серьезные исследования, публикуемые в таких научных журналах как «Нью-Инглэнд Джорнэл ов Медисин» проходят процесс так называемой «специализированной рецензии» перед публикацией. Это значит, что профессионалы – врачи, статистики и т.д. – прочитали это исследование до его публикации и заключили, что его авторы придерживались правил хорошего научного исследования и не пытали свои данные как средневекового еретика, чтобы числа отвечали их выводам. Всегда спросите, была ли работа рецензирована специалистами. Если да, то вы можете быть уверены, что полученная информация имеет хотя бы минимальную степень доверия. А если рецензирования не было, спросите почему. Возможно, исследование просто не было интересно достаточному количеству людей, чтобы получить рецензию. Или же это исследование имело такие же шансы выдержать проверку профессионалов, как 500-долларовый сборный домик имеет шансов выстоять против смерча. 3. Как собирались данные? Это очень важный вопрос, особенно если данные не прошли рецензию. Если это данные из опроса, то вам надо знать, были ли отобраны участники опроса случайно. Случайная выборка означает участие различных людей на большой территории. (А не только ваши друзья или футбольная команда, или соседи). 4. Скептически относитесь к сравнениям. Исследователи любят делать нечто, называемое «регрессия» – процесс, сравнивающий определенные вещи, чтобы определить, связаны ли они статистически. Специалисты называют такую связь «корреляцией» (взаимосвязью). Всегда помните, что взаимосвязь это НЕ причинная связь. Исследование может выявить, что уровень рождаемости связан с ежегодной миграцией аистов. Но это не значит, что аисты приносят детей. Или что младенцы привлекают аистов. Статистики называют такое «ложной корреляцией», являющейся красивым эвфемизмом к «абсолютно случайному совпадению». Люди, которые хотят что-то от других часто используют регрессивные исследования, чтобы поддержать свои выводы. Они будут говорить что-то вроде «исследование показывает, что новая политика полиции, которую мы хотим ввести, привела к падению уровня преступности на 20 процентов за десятилетний период в городе NN.» Это может быть правдой, но падение уровня преступности может быть вызвано чем-то другим, а не новой политикой. А если за эти 10 лет средний возраст населения города значительно вырос? Так как считается, что преступления зависят от возраста (чем больше молодых людей, тем больше преступлений), то потенциальной причиной снижения уровня преступности может быть старение населения. Изменения в политике и снижение уровня преступности могут быть взаимосвязаны. Но это не значит, что одно является причиной другого. 5. Наконец, помните о числа, вырванных из контекста. Слова о том, что их «специально отобрали», чтобы дать самое интересное, могут означать, что помещенные в другой контекст они могут иметь совершенно иное значение. Рассмотрим следующий пример Эрика Мейера, профессионального репортера, работающего в настоящее время в университете штата Иллинойс: Моим любимым приемом был используемый нами много лет назад, когда я работал в Милуоки. Когда шел сильный снег, мы звонили в офис шерифа, который отвечал за порядок на дорогах и спрашивали. Сколько в этот день было зарегистрировано автомобильных аварий. И мы писали такое сообщение «Мощная пурга обрушила на Милуоки 25 сантиметров снега, почти парализовала движение в час пик и привела к 28 авариям на дорогах графства». Пока в один прекрасный день я не спросил в офисе шерифа, сколько дорожных происшествий регистрировалось в ясные, солнечные дни. Ответ – 48 – заставил меня задуматься, а не писать ли в будущем, статьи, начинающиеся так «Сегодня мощная пурга предотвратила 20 дорожно-транспортных происшествий на дорогах графства». Не известно, было ли меньше ДТП на милю при езде по снегу или нет, но когда шел снег наверняка происходило меньше аварий. Людям легко потерять способность мыслить, когда они видят гору бумаг, забитую числами, таблицами и графиками. (И некоторые не очень честные источники рассчитывают на это.) Но ваши читатели полагаются на вас, веря, что вы разъясните им эти данные. Воспользуйтесь тем, чему вы научились из этого материала и рассматривайте данные более критически. (Критически, а цинично. В мире есть много прекрасной информации.) Самое плохое, что вы можете сделать как пишущий человек – передать чьи-то слова, содержащие данные, совершенно не зная стоит ли верить этому человеку или нет.
Подача цифр и данных – как статистика может обмануть вас (и ваших читателей)
«Ложь, гнусная ложь и статистика» (Марк Твен, цитируя британского премьер-министра Бенджамина Дизраэли). Когда вы смотрите на цифры и статистику, всегда задавайте себе 3 важных вопроса: - От кого? (источник информации) Насколько хороши ваши цифры? У журналистов (и людей вообще) обычно перестает работать мозг, когда они видят данные/цифры – статистику. Опасайтесь отсутствия исходного пункта. «На 10 процентов журналистов больше». Больше чего? Недавно мы обнаружили хороший пример того, как поместить большие числа или непонятные измерения в контекст, который будет понятен среднему читателю: Вопрос: Можно ли поместить 488 акров в контекст, т.е. это столько же, как? Так что ищите контекст. |