Вопросы статистики и статистических данных » Обсуждения

MS

Bookmark and Share




Русская терминология выбора стат. моделей по критерию Акайке ?

Ноя 27, 2009 | 04:11

Доброе время суток!

Я использую в работе выбор моделей по критерию Акайке вместо тестирования нулевых гипотез и оценки достоверности. Основные статьи по методу: http://warnercnr.colostate.edu/~anderson/

в международной экологической литературе этот метод наращивает популярность, в русскоязычной же его не найти.

Сейчас нужно объяснить кратко суть метода в кбн-овской диссертации. Буду очень благодарен за любые ссылки на русскоязычный источник, где описывается метод и предлагаются русские термины. Это поможет отвратить град гнилых  помидоров за "непосконность" метода.

Например, "parsemonius" применительно к моделям мы в узком кругу решили переводить как "'экономичная", но может есть уже принятый аналог в русском языке ?


Комментарии  

Вам необходимо зайти или зарегистрироваться для комментирования
Вы можете посмотреть описание критерия и его применения на странице: http://www.statsoft.ru/home/portal/exchange/akaike.htm.
2009-11-27 17:27:36 · Ответить · · Ссылка
Ktitorov PavelСпасибо!
Владимир, спасибо большое! Сильно поможет в описании метода. Но там к сожалению не все есть термины, кроме того, пример применения в Статистике предлагает использовать сначала достоверность, а потом AIC для выбора окончательной модели, что по Барнгаму и Андерсону запрещено. Кроме того, значения AIC у всех моделей сходные, что опять же по Барнгаму и Андерсону предполагает, что ни одна из них не лучше альтернативных. Тогда предлагается включить модель с максимальным количеством факторов, или провести усреднение коэффицентов по всем моделям.... В R это делается с помощью пакета MuMin, в статистике похоже не делается... . Если Вам встретится более полное русскоязычное описание, напишите пожалуйста...
2009-11-28 06:24:55 · Ответить · · Ссылка
А почему именно Акайке, а не Шварца? Вообще, все проверки имеют под собой некоторый условно-рациональный базис. Поэтому обычно их используют в совокупности.
2009-12-06 22:50:27 · Ответить · · Ссылка
Этот самый Дэвид Андерсон (см. ссылку выше) в последней книжке проводит сравнение AIС и BIC, и утверждает что Шварца критерий работает хорошо при небольших и средних выборках, и нескольких четких эфектах предикторов. Но в таких же ситуациях хорошо работает и AICc. Кроме того, при малых выборках значения AIC и BIC равны. Если есть много предикторов с равной объясняющей способностью, BIC якобы менее надежен. Рекомендует AICc, поскольку он надежен при малых выборках, а при больших приближается по величине не нескорректированному AIC. Про сочетание использования достоверности и правдоподобия с информационными критериями он пишет, что это разные статистические парадигмы, и в комбинации их использовать нельзя, особенно при выборе моделей. Недостоверная модель не обязательно неправдоподобная, и наоборот. Используя отбор по достоверности, можно выкинуть из модели важные переменные.
2009-12-07 02:43:26 · Ответить · · Ссылка
Думаю, что если переменные важные, то исследователь об этом знает и их не выкинет независимо от каких-то проверок и критериев. А если исследователь об этом не знает, то, вероятно, они и правда неважные. Хотя, может, зависит от сферы и характера исследования. По крайней мере в экономике размеры выборок обычно настолько малы, что все проверки и оценки параметров могут сильно изменится даже при добавлении/удалении одного наблюдения.
2009-12-07 03:04:02 · Ответить · · Ссылка
Ну в очевидных случаях конечно, по крайней мере в биол. наках ркомендовано включать такие переменные, механизм связи которых объясним. Иначе можно получится зависимость сроков прилета птиц от индекса Доу Джонса :) А что кксается добавления - удаления одного наблюдения при малых выборках, то тут у Акайки перед проверкой нулевых гипотез серьезное преимущество. Например, в простой регресси при малых выборках от добавления или исключения одного наблюдения тенденция может сохранятся (просто графически можно проверить), но она потеряет достоверность, и мы должны приянть нулевую гипотезу. Довольно искусственно, так ведь ? А при сравнении моделей по весам Акайке получится, что при одной выборки модель допускающая влияние независмой переменной скажем в 8 раз правдоподобнее "нулевой" модели , а при другой - в 7. Принципиально выводы о влиянии переменной это не изменит, и больше похоже на правду.
2009-12-07 04:05:42 · Ответить · · Ссылка