Analiza statystyczna jako część Data Science

Analiza statystyczna jako część Data Science

Posted on Posted in Uncategorized

Analiza statystyczna jako część Data Science

Analiza statystyczna i ogólna nauką jaką jest Data Science jest procesem generowania statystyk z przechowywanych danych i analizowania wyników w celu wywnioskowania lub określenia znaczenia związanego z zbiorem danych lub rzeczywistością, którą próbuje się opisać.

Statystyka jest zdefiniowana jako „… badanie, gromadzenie, analiza, interpretacja, prezentacja i organizacja danych.” Jest to zasadniczo to samo, co definicja Data Science, a w rzeczywistości termin Data Science został pierwotnie ukuty w 2001 r. Przez statystę Purdue’a William S. Cleveland w tytule do swojego artykułu „Data Science: plan działania dla poszerzenia obszarów technicznych w dziedzinie statystyki”.

Można więc powiedzieć, że informatyka to przede wszystkim analiza statystyczna, wraz z pomocniczymi funkcjami technicznymi do gromadzenia danych źródłowych i prezentowania analizowanych informacji.

Analiza statystyczna może być wykorzystana do:

Przedstawiania kluczowych ustaleń ujawnionych w zbiorze danych.
Podsumowania informacji.
Obliczania wskaźników spójności, trafności lub różnorodności danych.
Twórzenia prognoz na podstawie wcześniej zarejestrowanych danych.
Przetestowania przewidywań eksperymentalnych.
Każdy naukowiec zajmujący się danymi spędza większą część dnia na wykonywaniu niektórych lub wszystkich tych powyższych funkcji.

Analiza statystyczna jako Data Science

Analiza statystyczna jako część Data Science
Programy nauki zajmujące się Data Science koncentrują się głównie na nauczaniu technik analizy statystycznej nie tylko na tym, aby zapewnić uczniom konkretne narzędzia do ich przyszłej pracy, ale także by pomóc im w przyswojeniu statystycznych wzorców myślenia. Naukowcy zajmujący się danymi, analizują problemy z danymi w inny sposób niż większość ludzi, zarówno dlatego, że dysponują narzędziami umożliwiającymi przełamanie tych problemów w ciekawy i matematycznie uzasadniony sposób, jak również dzięki zaawansowanemu zrozumieniu teorii prawdopodobieństwa.

Teoria prawdopodobieństwa nie znajduje zastosowania tylko w zakurzonych klasach i pracowniach komputerowych. To ćwiczenie myślenia, które zmienia sposób patrzenia na świat. Poprzez zrozumienie matematycznego prawdopodobieństwa pewnych wyników statystycznych, naukowcy danych mogą stwierdzić na pierwszy rzut oka, czy widzą nowy i interesujący wgląd wynikający z ich analizy, czy po prostu naturalny rozkład wyników regulowany przez prawa przypadku. Ponadto mogą wykonywać obliczenia tych wyników, aby udowodnić, czy są one przypadkowe czy istotne statystycznie.

Analiza statystyczna i poważne podstawy matematyczne, na których opiera się, to jeden ważny powód, dla którego Data Science nie jest po prostu karierą, którą utalentowany absolwent uczelni może uczyć się przez samokształcenie i ciężką pracę. Magister Data Science, statystyki lub matematyki to jedyny skuteczny sposób na naukę tej ważnej tematyki.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *