Ну во первых только при определенном размере выборки. Во вторых это финальный учебный проект прошедший ревью. В третьих такое пишется в лс или вы хотите публично самоутвердиться и поспорить?
2023-04-03 12:43:19
Спорить не собираюсь)
Просто указал вам, раз уж вы опубликовали учебный проект, на очевидно неграмотные моменты в нем.
Ревью учебных проектов бывает некачественным, увы.
Не в личку, т.к. думал что остальным участникам это тоже будет интересно.
2023-04-03 12:41:53
Может текст написан и запутано, но что не так с использованием бутстрапа и самими результатами тестов?
2023-04-03 12:43:23
Ну вы используете громоздкий и долгий бутстреп там, где он не нужен, а работает быстрый аналитический t test.
Стат значимость конверсии считаете зачем-то через хи-квадрат, хотя для нее тоже есть простая модификация t-test.
Это если кратко.
2023-04-03 12:49:33
Цель проекта была посмотреть что такое бустрап, а хи квадрат там используется потому что переменная категориальная
2023-04-03 13:08:53
Ох, ладно, простите, не буду дальше спорить. Пусть будет как будет)
2023-04-03 12:55:33
Ваша цитата. Весь чат читает и некоторые участники могут подумать, что вот она моя конверсия, вот он мой любимый t-test, ура, иду на гитхаб. Спасибо, что пояснили, а то многие в чате могли ненароком обмануться Вашим утверждением выше
2023-04-03 13:12:26
Так, погодите.
Я сказал, что t-test работает идеально? Нет.
У человека в его проекте написано что t-test НЕ РАБОТАЕТ на таких ( "неравномерных", цитирую) данных.
Это ошибка.
Я про нее и пишу. И выше уже про цитаты из википедии все разобрали.
Есть ли тесты быстрее и надежнее t-теста? 100% есть.
Это как бейзлайн модель по сути.
2023-04-03 13:12:02
подождите,
на смещенных выборках t-test не работает и в статье от vk это тоже указывается,
(As you can see, higher skewness drops the power of the t-test significantly. Furthermore, for very skewed distributions, t-test p-values clearly don’t follow uniform distribution under H0)
что скрывается под "неравномерных" непонятно, возможно про это и говорится, но несколько косноязычно
2023-04-03 13:39:06
В статье выше, с хабра - t-тест на скошенной выборке заработал. Кому верить в этом жестоком мире?)))
2023-04-03 13:40:04
Давайте так: на самом деле зачастую в калькуляторах / в статьях даже вместо т-распределения подставляется стандартное нормальное, потому что т-расп сходится к нормальному при н к бесконечности (то есть когда вы набрали хотя бы тыщу юзеров, вроде даже хотя бы сто)
И это почему-то продолжают называть т-тестом, хотя это на деле асимптотический з-тест, основанный только на цпт, то есть вам нужна только конечная дисперсия. И можно не переживать за неравномерность, что бы оно ни значило
(Но если у вас 10 юзеров в тесте, то да, тест сттюдента не поможет))
2023-04-03 13:57:12
данные должны быть нормально распределенными
2023-04-03 12:49:11
Нет, это как раз ошибка, достаточно частая(
2023-04-03 12:50:04