Перлы и ляпы
Весна 2010. Задание: Данные из стандарной поставки Stata (auto.dta) - провести простое дескриптивное описание данных; сделать анализ о пригодности данных к дальнейшему использованию; выявить закономерности в распределении данных с помощью графического и корреляционного анализа.
"А<...> Варвара. К<...> Аня. Ш<...> Машенька. Группа <...>" - работа так подписана.
"В таблице существует 8 интервальных критериев.2 плавающих критерия(потому что данные с точками ). 1 текстовый критерий ( страна –производитель)" - для непосвященных - речь идет о переменных с числовыми данными и номинальными.
"Данная таблица более внимательно анализирует одну из групп наблюдений" - а должен анализировать тот, чьим именем подписана работа.
"После команды describe мы имеем Аккуратно представленные данные" - А как же еще?
"Посредством команды list in 1 мы получили улутшенное видение наблюдений." - без комментариев
"Избавившись от лишних характеристик с помощью drop, мы можем наконец с казать, какие у нас данные со сколькими переменными." - без комментариев
"Редкие исключения, такие как 2 машины с единичным ремонтом продавались по низкой цене(возможно это были жигули)" - в американской выборке.
"статистику, позволяющую сравнить данные по местным ( ну тем местным) и импортным машинам." - попалось дважды. Дословно. Будем выяснять.
"Рассмотрим на графике зависимость веса от длины автомобиля. По графику прослеживается зависимость, хоть и не очень четкая (а мне кажется четкая)" - раздвоение личности? Или чат?
"Ясно видно, что физические характеристики зависят друг от друга, а также от количества оборотов" - без комментариев
"Представим графически эту зависимость, для более наглядного видения." - чего уж там..
"Выявление зависимости по другим характеристикам с помощью графиков не привело к показательным результатам.
Однако связь можно увидеть с помощью коэффициента корреляции" - просто не получилось, давайте усложним?!
"Посмотри зависимость цены и передаточного числа с помощью методов, использующихся раньше." - Мне предлагают это сделать?
"В таблице представлены данные: числовые и дискретные." - без комментариев
В работе:
0.4949 - прямая слабая связь
0.5386 - прямая средняя связь
Я так полагаю, что 0.5 это как некий водораздел. Если до 0.5 - то слабая, если больше, то средняя. Что-то незыблемое, как бетонный отбойник. Ан нет, в жизни это лишь как двойная сплошная для некоторых:)
"При сравнении высоты салона и длины автомобиля был просчитан коэффициент парной корреляции. Он составил 0,52. Это говорит о том, что связь между данными характеристиками чуть выше средней." - Есть средняя корреляция? Между всем в мире? Между оценкой за статистику и напором воды? Или скоростью закипания чайника дома и вкусом чая в столовой? И средняя у всех этих корреляций, видимо, 0.5?
"...со здравым смыслом..." - убирать нужно эту фразу-паразит. Нет такого понятия. Вы не можете знать всех процессов. Есть физика, но здравого смысла в природе нет, есть только лично Ваше мнение, а оно будет описано лишь одним наблюдением в ряду данных.
"..зависимость «аппетита» автомобиля от его веса." - избегаем жаргонизмов.
"Как правило, чем больше <...>, тем больше <...>." - А статистически это как сказать?
Сначало...
...граффик...
"Данная Выборка показывает..." - о Великий Бог :)
"На графике видно, что занос автомобиля зависит от его длины, т.е. чем длинее автомобиль, тем больше занос." - отпечатка шин, впрочем, к работе не приложено.
"теперь совершим повторное дискрайб"
И напоследок, количество пишется с одной "л".
THANK YOU FOR YOUR ATTENTION!!! (с) Ли, Иванов