Ну, где то так. Не будем трогать деталей и терминологии, они в контексте разговора явно нипричем. Важных моментов тут может быть два. Во-первых влияние этих весовых коэфициентов очень велико, они очень сильно влияют на результат, а не несколько корректируют для большей точности. Во-вторых можно с большой вероятностью предположить, что практически работа ведется примерно так: не очень высокой квалификации сотрудник вводит очередную кучу данных на вход программы, принципы работы которой он понимает менее чем приблизительно, и забирает с ее выхода таблицу результатов. Каждый случай перенастройки программы, такие как вгоняние в нее набора новых весов полученых по результатом новой переписи населения чревато возникновением какой-нибуть систематической ошибки. Новые данные, например, могут иметь немного другую структуру, но не очень квалифицированый сотрудник не обратит на это внимание, а просто грубой силой вколотит на место старых, по принципу максимальной похожести.
Если нам интересен именно график иудейских предпочтений, то неплохо бы было выяснить: применяли авторы оверсемплинг и если да, то откуда они этих дополнительных евреев брали. Сейчас и в более ранних исследованиях. Случайным перезвоном они в америке очень мало евреев получат, в свою 2.5К выборку. Если они таки со случайной группой работали, то см. выше -- недостаточная численность увеличит роль весовых и корректировочных вычислений.
no subject
Важных моментов тут может быть два. Во-первых влияние этих весовых коэфициентов очень велико, они очень сильно влияют на результат, а не несколько корректируют для большей точности. Во-вторых можно с большой вероятностью предположить, что практически работа ведется примерно так: не очень высокой квалификации сотрудник вводит очередную кучу данных на вход программы, принципы работы которой он понимает менее чем приблизительно, и забирает с ее выхода таблицу результатов. Каждый случай перенастройки программы, такие как вгоняние в нее набора новых весов полученых по результатом новой переписи населения чревато возникновением какой-нибуть систематической ошибки. Новые данные, например, могут иметь немного другую структуру, но не очень квалифицированый сотрудник не обратит на это внимание, а просто грубой силой вколотит на место старых, по принципу максимальной похожести.
Если нам интересен именно график иудейских предпочтений, то неплохо бы было выяснить: применяли авторы оверсемплинг и если да, то откуда они этих дополнительных евреев брали. Сейчас и в более ранних исследованиях. Случайным перезвоном они в америке очень мало евреев получат, в свою 2.5К выборку. Если они таки со случайной группой работали, то см. выше -- недостаточная численность увеличит роль весовых и корректировочных вычислений.