Статистика: конспект лекций - Л. Неганова
Шрифт:
Интервал:
Закладка:
Таблица 2.1
Классификация ошибок наблюдения
По своему характеру ошибки делятся на случайные и систематические. Случайными называют ошибки, возникновение которых обусловлено действием случайных факторов. К ним относятся оговорки и описки опрашиваемого лица. Они могут быть направлены в сторону уменьшения или увеличения значения признака, на конечном результате они, как правило, не отражаются, так как взаимопогашаются при сводной обработке результатов наблюдения. Систематические ошибки имеют одинаковую тенденцию либо к уменьшению, либо к увеличению значения показателя признака. Это связано с тем, что измерения, например, производятся неисправным измерительным прибором или ошибки являются следствием неточной формулировки вопроса программы наблюдения и др. Систематические ошибки представляют большую опасность, так как в значительной мере искажают результаты наблюдения.
В зависимости от стадии возникновения различают ошибки регистрации; ошибки, возникающие в ходе подготовки данных к машинной обработке; ошибки, проявляющиеся в процессе обработки на вычислительной технике.
К ошибкам регистрации относятся те неточности, которые возникают при записи данных в статистический формуляр (первичный документ, бланк, отчет, переписной лист) или при вводе данных в вычислительную технику, искажение данных при передаче через линии связи (телефон, электронную почту). Часто ошибки регистрации возникают из-за несоблюдения формы бланка, т. е. запись произведена не в ту строку или графу документа. Случается и преднамеренное искажение значений отдельных показателей.
Ошибки при подготовке данных к машинной обработке или в процессе самой обработки возникают в вычислительных центрах или центрах подготовки данных. Возникновение таких ошибок связано с небрежным, неправильным, нечетким заполнением данных в формулярах, с физическим дефектом носителя данных, с потерей части данных из-за несоблюдения технологии хранения информационных баз либо определяются сбоями в работе оборудования.
Зная виды и причины возникновения ошибок наблюдения, можно в значительной мере снизить процент подобных искажений информации. Различают следующие виды ошибок:
ошибки измерения, связанные с определенными погрешностями, которые возникают при однократном статистическом наблюдении явления и процессов общественной жизни;
ошибки репрезентативности, возникающие в ходе несплошного наблюдения и связанные с тем, что сама выборка не репрезентативна, и результаты, полученные на ее основе, не могут распространяться на всю совокупность;
преднамеренные ошибки, возникающие из-за сознательного искажения данных с разными целями, среди которых желание приукрасить действительное состояние объекта наблюдения или, наоборот, показать неудовлетворительное состояние объекта (данное искажение информации является нарушением закона);
непреднамеренные ошибки, как правило, носящие случайный характер и связанные с низкой квалификацией работников, их невнимательностью или небрежностью. Часто такие ошибки связаны с субъективными факторами, когда люди дают неправильную информацию о своем возрасте, семейном положении, образовании, принадлежности к социальной группе и т. д. или просто забывают некоторые факты, сообщая регистратору информацию, которая только что возникла в памяти.
Желательно провести некоторые мероприятия, которые помогут предупредить, выявить и исправить ошибки наблюдения. К ним относятся:
• подбор квалифицированных кадров и качественное обучение персонала, связанного с проведением наблюдения;
• организация контрольных проверок правильности заполнения документов, сплошным или выборочным методом;
• арифметический и логический контроль полученных данных после завершения сбора материалов наблюдения.
Основными видами контроля достоверности данных являются синтаксический, логический и арифметический (табл. 2.2).
Таблица 2.2
Виды и содержание контроля
Синтаксический контроль означает проверку правильности структуры документа, наличия необходимых и обязательных реквизитов, полноту заполнения строк формуляров в соответствии с установленными правилами. Важность и необходимость синтаксического контроля объясняется применением для обработки данных вычислительной техники, сканеров, которые предъявляют жесткие требования к соблюдению правил заполнения формуляров.
Логическим контролем проверяются правильность записи кодов, соответствие их наименованиям и значениям показателей. Выполняется проверка необходимых взаимосвязей между показателями, сопоставляются ответы на различные вопросы и выявляются несовместимые сочетания. Для исправления ошибок, выявленных при логическом контроле, возвращаются к исходным документам и делают поправки.
При арифметическом контроле сравниваются полученные итоги с предварительно подсчитанными контрольными суммами по строкам и по графам. Довольно часто арифметический контроль основывается на зависимости одного показателя от двух или нескольких других, например является произведением других показателей. Если арифметический контроль итоговых показателей обнаружит, что данная зависимость не соблюдается, это будет свидетельствовать о неточности данных.
Таким образом, контроль достоверности статистической информации осуществляется на всех этапах проведения статистического наблюдения, начиная со сбора первичной информации и до этапа получения итогов.
Тема 3. СТАТИСТИЧЕСКАЯ СВОДКА И ГРУППИРОВКА
3.1. Задачи сводки и ее содержание
Научно организованная обработка материалов статистического наблюдения по заранее разработанной программе включает в себя, кроме контроля данных, систематизацию, группировку данных, составление таблиц, получение итогов и производных показателей (средних и относительных величин) и т. д. Собранный в процессе статистического наблюдения материал представляет собой разрозненные первичные сведения об отдельных единицах изучаемого явления. В таком виде материал еще не характеризует явление в целом: не дает представления ни о величине (численности) явления, ни о его составе, ни о размере характерных признаков, ни о существе связей этого явления с другими явлениями и т. д. Возникает необходимость в специальной обработке статистических данных – сводке материалов наблюдения.
Сводка материалов наблюдения представляет собой комплекс последовательных действий по обобщению конкретных единичных данных, образующих совокупность, с целью обнаружения типичных черт и закономерностей, присущих изучаемому явлению в целом.
Статистическая сводка (простая сводка) в узком смысле слова представляет собой операцию по подсчету общих итоговых (суммарных) данных по совокупности единиц наблюдения. Статистическая сводка (сложная сводка) в широком смысле слова включает в себя также группировку данных наблюдения, подсчет общих и групповых итогов, получение системы взаимосвязанных показателей,
представление результатов группировки и сводки в виде статистических таблиц.
Правильная, научно организованная сводка, опираясь на предварительный глубокий теоретический анализ, позволяет получить все статистические итоги, отражающие важнейшие, характерные черты объекта исследования, измерить влияние различных факторов на результат и учесть все это в практической работе при составлении текущих и перспективных планов. Задача сводки – дать характеристику объекту исследования с помощью систем статистических показателей, выявить и измерить таким путем его существенные черты и особенности. Эта задача решается на трех этапах:
• определение групп и подгрупп;
• определение системы показателей;
• определение видов таблиц.
На первом этапе осуществляется систематизация, группировка материалов, собранных при наблюдении. На втором этапе уточняется предусмотренная планом система показателей, с помощью которых количественно характеризуются свойства и особенности изучаемого предмета. На третьем этапе исчисляются сами показатели, и обобщенные данные для наглядности и удобства представляются в таблицах, статистических рядах, графиках, диаграммах.
Перечисленные этапы сводки еще до начала ее проведения отражаются в специально составляемой программе. Программа статистической сводки содержит перечень групп, на которые целесообразно разделить совокупность, их границы в соответствии с группировочными признаками; систему показателей, характеризующих совокупность, и методику их расчета; систему макетов разработочных таблиц, в которых будут представлены итоги расчетов.