상호배제와 전체포괄

베이즈 이론은 데이터 D의 관점에서 봤을 때 가설 H의 확률을 수정하는 방법이다. D와 H를 사용하여 베이즈이론을 표현하면
p(H|D) = [p(H)p(D|H)] / p(D)

p(H|D) : 사후확률-데이터를 확인한 후의 가설의 확률
p(H) : 사전확률-데이터를 보기 전의 가설의 확률
p(D|H) : 우도-데이터가 가설에 포함될 확률
p(D) : 한정상수-가설에 포함되는 데이터의 비율

한정상수(normalizing constant)는 어느 가정에서나 데이터를 볼수 있는 확률인데 사실 뭔 소리인지 모르겠다. 그래서 다음의 두 가지를 사용하여 한정상수의 의미를 정의한다.
* 상호배제(mutually exclusive) - 여러 개의 가설이 존재하는 데 그중 하나만 참인 경우. 나머지 가설은 거짓?
* 전체포괄(collectively exhaustive) - 다른 가능성이 전혀 없는 경우, 즉 생각치 못한 다른 가설이 존재할 수 없으며(상상할 수 있는 모든 가설은 다 나왔다?) 그중 한 개 이상은 적어도 참(참이 한 개 또는 두 개 이상)-가설 모두가 거짓인 경우는 없다?

이런 성격의 가설집합을 Suite이라고 한다. 한정상수를 계산하려면 전체확률법칙을 사용한다.
p(D) = SUM of p(H)p(D|H)



통시적,通時的,diachronic


Bayes' theorem을 읽다보면 "diachronic"이라는 단어가 보인다. 사전을 보니 통시적이라는데 도통 한글-한자를 보면 의미가 확 들어오진 않는다. 사전을 보면 주로 언어학에서 사용하는 전문용어처럼 보인다.

"통시적" 이란 말에는 시간의 흐름이 들어가 있다. 역사를 연구할 때 시간의 흐름을 연구하는 방법이 있고, 한 시점의 시대적 상황을 고려하는 연구방법이 있을 수 있다(이런 걸 공시적-synchronic 이라 함)

다시 Bayes' Theorem으로 돌아와서 가설H의 (사전)확률이 정해지고 시간이 흐른 후 새로운 데이터가 들어오면서 이를 반영하여 달라지는 걸 "diachronic interpretation"이라고 부른다.

암튼 경제학과 학생에겐 그냥 "시계열" 같은 의미이다. 그나저나 뭐 이리 어려운 말을 사용하는 지... 무식이 철철 넘치고 있는 중이다.

R몬테칼로와 함께 하는 베이지안 통계추론

몇 달전에 데이터사이언티스트 전희원님(freesearch.pe.kr)의 추천으로 산 책이다. 베이지안 통계에 대해 잡다한 지식으로 정리가 안된 느낌이 있어 공부를 하려고 샀는데, 처음만 보고 몇 달동안 묵혀둔 것인데, 일에 치여 살다보니 공부가 너무 하고 싶어서 다시 정주행중이다.

책에 나온 예제를 하나 하나 풀어보니 고등학교때 확률문제를 풀던 추억이 방울 방울...알듯 말듯한 그 느낌

파이썬을 이용한 시스템 트레이딩 (기초편) PYTHON

오래 전에 '시스템트레이딩'에 대단한 기대를 가졌지만, 기대만큼 시장에서 크지 못하는 것 같습니다(시스템트레이딩하던 프랍데스크들도 다 짐싸서 집에 갔습니다) 만일 그랬다면 이넘의 자산운용사, 자문사, 증권사, 투신 등등 시장이 펀드매니저 대신 프로그래머와 모델링하는 사람을 많이 찾을 텐데 말이죠. 실제 운용하는 걸 보면 그들만의 리그입니다. 블럭딜과 주식대차, 정보로 대표되는 리그밖에 있는 개미는 그만큼 돈 벌기 힘듭니다(좋은 정보 받고 공매도하고 블록딜한다고 해서 다 먹는 건 아닙니다)

펀드매니저중에는 뛰어난 능력을 보여주는 분도 있지만 펀드규모가 커질 수록 상대적으로 양질의 정보를 신속히 주고 받는 인적 네트워크와 블럭딜과 주식대차없이 활황장이 아닌 시장에서 펀드매니저의 순수 역량으로 수익을 내기는 힘들다고 봅니다. 특히 펀드규모가 1천억이 넘어가면 좁은 시장에서 살만한 주식도 안보이고 20~30개의 종목을 왕창 들고 있기도 힘듭니다.

채권을 사서 주식대차용 담보로 삼거나 시장수익율을 따라 가기 위해 지수ETF를 들고 있는 방안이 있지만 액티브 펀드매니저 입장에선 마음에 드는 방법은 아니겠죠. 아무튼 그래서 사람이 부담하는 스트레스도 큽니다. 시스템이라고 해서 별 방법이 없죠. 사람이 하는 일을 정해진 룰대로 신속하게 처리하는 거라... 다만 기계학습과 빅데이터를 활용하는 시스템이 사람이 보지 못하는 곳을 보여줄 수 있을 지도 모릅니다. 시스템은 사람을 대신하는 게 아니라 보완하는 거라 보는데...

기계학습과 빅데이터를 활용하는 시스템은 아니지만 대신증권, 이트레이드(최근 사명이 이베스트투자증권으로 변경-왜 좋은 이름을 버리는 지 모르겠어요) API와 파이썬을 사용한 시스템트레이딩관련 온라인 책이 있습니다. 증권투자를 하시며 파이썬을 사랑하는 분은 한번 보셨으면 좋을 듯 합니다.

[URL]파이썬을 이용한 시스템 트레이딩 (기초편)

R 3.1.3 출시와 쉬운 업그레이드 GNU R

R이 최근 업그레이드 되었나 봅니다. 그런 소식에 워낙 무심하다보니 남들이 보내주는 뉴스레터를 통해 알게 되었군요.
그런데 흥미롭게 이번에 관심이 가는 게 R 업그레이드 방법입니다. 그냥 (윈도버전) R 패키지와 업데이트 명령으로 R을 업그레이드 할 수 있나 봅니다. 다음은 뉴스레터에서 본 R 업그레이드 내용입니다 (참고로 전 아직 안해봤습니다)
--------------------------------------------------------
Upgrading to R 3.1.3 on Windows

If you are using Windows you can easily upgrade to the latest version of R using the installr package. Simply run the following code:

# installing/loading the latest installr package:
install.packages("installr"); library(installr) #load / install+load installr

updateR() # updating R.
Running “updateR()” will detect if there is a new R version available, and if so it will download+install it (etc.).

I try to keep the installr package updated and useful, so if you have any suggestions or remarks on the package – you are invited to leave a comment below.
--------------------------------------------------------
[URL]R 3.1.3 is released (+ easy upgrading for Windows users with the installr package)

1 2 3 4 5 6 7 8 9 10 다음