Garbage In, Garbage Out – automatyzacja

Garbage In, Garbage Out – automatyzacja

przez -
3 2669
Udostępnij na:

Przy tworzeniu systemów opartych o sieci neuronowe, nauczania maszynowego, czy też z zastosowaniem maszyny wektorów nośnych należy zawsze pamiętać, że z danych wejściowych złej jakości otrzymamy wynik również złej jakości. Dodatkowo należy pamiętać o kwestii, w której wydanie bezsensownego polecenia w systemach opartych o chociażby czystą cenę i dane wejściowe w formacie OHLC również sprawi, iż wynik będzie bez sensu. Jest to jedna z podstawowych zasad, której należy przestrzegać przy szeroko pojętej automatyzacji systemów, czy też przy modelowaniu systemów predykcyjnych.

Do nauki tworzenia systemów opartych o nauczanie maszynowe/SVM polecam tutorial SVM-Tutorial.com. Dzięki temu tutorialowi zdobędziemy wiedzę w wykorzystaniu języków R oraz C# na potrzeby tworzenia systemów.

Jeśli jednak komuś jest bliższy Python to nie pozostaje nic innego jak zarekomendowanie jednego z lepszych kursów od polskiego autorytetu – Mateusza Harasymczuka z astrotech.io Python 3: from None to Machine Learning. Swoją drogą, ekipa z astrotech.io pracuje nad stworzenie wielotomowego podręcznika do nauki i wykorzystania Pythona. Takiego podręcznika w Polsce jeszcze nie było. Podejrzewam, że na świecie również. Także trzymam kciuki za sprawne prace nad finalizacją książki wartej każdej ceny.

O Polakach i ich niesamowitych skillach/miejscach pisałem na początku obecnego roku – Polacy nie gęsi i swoich ekspertów mają !

Wracając do tworzenia systemów. Mimo, iż nie jestem zwolennikiem handlu w oparciu o analizę fundamentalną, to już dodanie makroekonomicznych wskaźników do systemów opartych o cenę może znacząco zwiększyć jego skuteczność zarówno w predykcji jak i skuteczność handlową.

Podstawowym źródłem takich wskaźników są urzędy statystyczne lub niezależne organizacje non-profit zajmujące się badaniami w dziedzinie ekonomii. Jednak przeglądanie zasobów pojedynczych urzędów danego regionu, a następnie ściąganie data set’ów z kilkunastu, kilkudziesięciu źródeł mogłoby zaszkodzić wydajności systemu. Toteż takowe dane warto pobierać z organizacji, firm ukierunkowanych na badania ekonomiczne.

Jedną z takich organizacji jest „National Bureau of Economic Research (NBER)”, która dodatkowo kładzie ogromny nacisk na badania empiryczne. Ze strony NBER istnieje możliwość pobrania setek tysięcy danych dotyczących wskaźników ekonomicznych Stanów Zjednoczonych, szczególnie tych które nie są podawane na bieżącą do informacji publicznej za pośrednictwem mediów finansowych.

Kolejnym źródłem bardzo dobrej jakości danych jest Economagic.com – potężny zbiór danych i wskaźników ekonomicznych z całego świata. Co prawda dane dostępne są za opłatą, jednak nie jest to kwota wygórowana i jak najbardziej do zaakceptowania dla przeciętnego portfela.

Przy tworzeniu modeli warto również korzystać z zasobów akademickich i tak np. kopalnią zasobów jest Wydział Ekonomiczny Uniwersytetu w Harvardzie – Department of Economics Links.

Warto również czerpać dane z bazy ETF’ów. Bodajże jedna z najlepszych – ETF Database

3
Dodaj komentarz

Dodaj zdjęcia
 
 
 
 
 
Dodaj video
 
 
 
 
 
Dodaj inne pliki
 
 
 
 
 
3 Comment threads
0 Thread replies
0 Followers
 
Most reacted comment
Hottest comment thread
3 Comment authors
  Subscribe  
najnowszy najstarszy
Powiadom o
Filip

Dzięki za link do kursu! Właśnie jestem na etapie poszukiwań ciekawych learningów do Pythona!

wojtas

dane z nber.org kozak. dzięki za podzielenie się!

Tomek

Dzięki za ten wpis i podanie konkretnych źródeł. Właśnie szukałem w internecie dobrych materiałów o Python, z nieba mi spadłeś :)