Журнал: Социология: методология, методы, математическое моделирование (Социология:4М)Зангиева И. К.Проблема пропусков в социологических данных: смысл и подходы к решению

Журнал: Социология: методология, методы, математическое моделирование (Социология:4М)

Зангиева И. К.

Проблема пропусков в социологических данных: смысл и подходы к решению


Зангиева Ирина Казбековна
Национальный исследовательский университет «Высшая школа экономики»
аспирант и преподаватель кафедры методов сбора и анализа социологической информации НИУ

Полный текст

Открыть текст

Ссылка при цитировании:

Зангиева И. К. Проблема пропусков в социологических данных: смысл и подходы к решению // Социология: методология, методы, математическое моделирование (Социология:4М). 2011. № 33. С. 28-56.

Рубрика:

ПРАКТИКИ СБОРА И АНАЛИЗА ФОРМАЛИЗОВАННЫХ ДАННЫХ

Аннотация:

Содержание настоящей статьи может послужить первым шагом к выработке рекомендаций по выбору способа работы с отдельными пропусками в данных сегодня. В статье предлагаются методы учета конкретной исследовательской ситуации при выборе способов работы с пропусками после сбора данных; выделяются условия, при которых имеет смысл искусственно заполнять пропуски; предлагается способ сравнения алгоритмов заполнения пропусков на основе специально организованного эксперимента; рассматриваются возникающие при этом трудности; строится типология используемых для заполнения пропусков алгоритмов, дающая возможность сократить количество последних при сравнении.

Литература:

  • Lillard L., Smith J.P., Welch F. What Do We Really Know About Wages? The Importance of Nonresponce and Census Imputation // Journal of Political Economy. 1986. No. 5. P. 489–506.
  • Sousa-Poza A., Hanneberger F. Wage Data Collected by Telephone Interviews: an Empirical Analysis of the Item Nonresponce Problem and Its Implications for the Estimation of Wage Functions // Schweizerishee Zeitschift fur Volkswirtschaft und Statistik. 2000. No. 136. S. 79–98.
  • Sande I. Imputation in Surveys: Coping with Reality // The American Statistician. 1982. No. 36(3). P. 145–153.
  • Dilman D.A. Mail and Telephone Surveys: The Total Design Method. N.Y.: John Willey and Sons, 1978. P. 230–245.
  • Pickery J., Billiet J. Item Non-response as a Predictor of Unit Non-response in a Panel Survey // International Conference on Survey Non-response. Portland Oregon (USA), 1999. Р. 48–67.
  • Shrapler J-P. Respondent Behavior in Panel Studies: A Case Study of the German Socio – Economic Panel (GSOEP) // DIW Discussion papers. DIW – Berlin. 2001. No. 224. Р. 65–74.
  • Hill D., Willis R.J. Reducing Panel Attrition: A Search for Effective Policy Instruments // Journal of Human Recourses. 2001. No. 36 (3). Р. 416–438.
  • Hanefeldt U. Das sozio-ekonomische Panel: Grundlagen und Konzeption. Frankfurt/Main: Campus Verlag, 1987. S. 171–186.
  • Little R.J., Rubin D.B. Statistical Analysis with Missing Data. N.Y.: John Willey and Sons, 1978.
  • De Leeuw E. D., Joop H., Huisman М. Prevention and Treatment of Item Nonresponse // Journal of Official Statistics. 2003. No. 19(2). P. 145–160.
  • Simonoff J.S. Regression Diagnostics to Detect Nonrandom Missingness in Linear Regression // Technometrics. 1988. No. 30(2).
  • Hoaglin D.C., Welsch R. E. The Hat Matrix in Regression and ANOVA // The American Statistician. 1978. No. 32. P. 17–22.
  • Cohen J., Cohen P. Applied Multiple Regression // Correlation Analysis for the Behavioral Sciences. 2nd ed. N.J.: Lawrence Erlbaum, 1983. P. 281–289.
  • Zweimuller J. Survey Non-response and Biases in Wage Regressions // Economic Letters. 1992. No. 39. P. 105–109.
  • Biewen M. Item Non-response and Inequality Measurement: Evidence from the German Earnings Distribution // Allgemeines Statistiches Archive. 2001. No. 85. P. 409–425.
  • Чуриков А.В. Основы формирования выборки: лекции для студентов направления 521200 (Социология). М.: ГУ–ВШЭ, 2005.
  • Daubler T. Nonresponseanalysen der Stichprobe F des SOEP // DIW Berlin. 2002. No. 15. S. 219–249.
  • Barnard. J.,Meng. X.L. Applications of Multiple Imputation in Medical Studies: from AIDS to NHANES // Statistical Methods in Medical Research. 1999. No. 8. P. 227–244.
  • Little R.J. Survey Nonresponse Adjustments for Estimates of Means // International Statistical Review / Revue Internationale de Statistique. 1976. No. 54(8). P. 139–157.
  • Злоба Е., Яцкив И. Статистические методы восстановления пропущенных данных // Computer Modelling &New Technologies. 2002. № 6. С. 55–56.
  • Delyon B., Lavielle M., Moulines E. Convergence of a Stochastic Approximation Version of the EM Algorithm // The Annals of Statistics. 1999. No. 27. P. 94–128.
  • Wu C.F. On the Convergence Properties of the EM-algorithm // The Annals of Statistics. 1983. No. 11(1). P. 95–103.
  • SPSS Missing Value Analysis 12.0 [on-line]. URL: http://www.spss.ru/products/missing_value/mva12.pdf.
  • Rubin D.B. Multiple Imputation after 18+ Years // Journal of the American Statistical Association. 1996. No. 91. P. 473–489.
  • Horton N. J, Lipsitz S.R. Multiple Imputation in Practice: Comparison of Software Packages for Regression Models with Missing Variables // The American Statistician. 2001. No. 55(3). P. 244–254.
  • Schafer J. L. Multiple Imputation: A Primer // Statistical Methods in Medical Research. 2001. No. 8. P. 3–15.
  • Allison P.D. Multiple Imputation for Missing Data: A Cautionary Tale // Sociological Methods and Research. 2000. No. 28. P. 301–309.
  • Zhang P. Multiple Imputation: Theory and Method // International Statistical Review / Revue Internationale de Statistique. 2003. No. 71(3). P. 581–592.
  • Ibrahim J. G. Incomplete Data in Generalized Linear Models // Journal of American Statistical Association. 1990. No. 85. P. 765–769.
  • Barnard J., Rubin D.B., Zanutto E. Lecture Notes of the Short Course on Multiple Imputation for Missing Data. Utrecht, 1997.
  • Kalton G., Kasprzyk D. The Treatment of Missing Survey Data // Survey Methodology. 1986. No. 12. P. 1–16.
  • Allison P.D. Missing Data // Sage University Papers Series on Quantitative Applications in the Social Sciences. CA.: Sage, 2001. No. 136.

Содержание выпуска

>> Содержание выпуска 2011. № 33.
>> Архив журнала