?(성공 = 행복)

성공과 행복은 동치관계인가?

성공하지 않고 행복한 것은 불가능할까? 행복이 성공을 의미하는 것일까? 아니면 성공이 행복을 의미하는 것일까?

아니면, 행복하지 않지만 성공할 수 있을까?

이런 생각들은 내가 행복한 이후에 해야 하는건가, 아니면 행복하기 전에도 해도 되는 걸까

성공한 이후에 행복에 대해 논할 수 있을까?

볼만한 강연

한 30%정도 알아들었다. 나는야 망할 귀먹은 인간 -_-;

오차 처리

아까 그 친구가 이번엔 다른 질문을 해왔다. 그래프를 그려봤더니 오차 범위가 너무 커서 줄이고 싶댄다. 이봐, 그러고 싶으면 실험을 다시 해야지…-_-;

실험을 다시 할 여유는 없고 뭔가 적당한 땜빵을 통해서 처리하고 싶다고 해서 통계과에 물어 봤더니 로그를 취해서 통계를 내 보라고 했댄다.

로그로 그래프를 그리는 것도 물론 의미가 있는 행위이기 때문에 그럴 수 있긴 한데, 문제는 로그를 취하는 시점이다.

1. 평균을 내고, 분산을 구한 후, 각각에 로그를 취한다.

2. 원래의 실험값에 로그를 취한 후, 각각에 평균을 내고 분산을 구한다.

이 두가지 방법은 비슷해 보이지만 다른 결과를 내놓는다. 그 친구의 질문 중에는 상용로그냐 자연로그냐 아니면 다른 밑을 선택해야 하느냐는 질문도 있었지만, 모든 로그는 고등학교때 배운 밑변환 공식을 통해서 서로 상수배의 차이밖에 없으므로 그건 중요하지 않은 질문이다. 바꾸고 싶으면 숫자 하나만 곱해주면 되기 때문이다.

값 2개만 생각해 보자. 10과 100이다. 알다시피 평균은 55이고 분산은 45이다. 여기에 상용로그를 취해주면 1.74와 1.65가 각각 평균의 로그값과 분산 로그값이다. (분산과 표준편차는 로그의 세상에서는 2배차이밖에 없으므로 아무거나 써도 된다.)

하지만 로그를 먼저 취하면 1과 2가 된다. 간단히 계산해 보면 평균은 1.5이고 분산은 0.25이다. 평균은 뭐 그럭저럭 비슷한데 분산은 완전히 달라진다. 이렇게 된 이유는 무엇일까?

사실 로그를 취한다고 해서 통계적인 값들이 달라지면 안된다. 의미가 달라져도 안된다. 그런데 위와 같은 과정에서는 값이 달라지고 의미도 달라졌다.

우선, 평균을 내고 분산을 구한 다음에 나중에 로그를 취하는 것은 원래의 값이 어땠는지 그대로 놔두고 그 값의 경향성을 로그로 분석한다는 의미가 된다. 하지만 로그를 먼저 취하고 그 값의 평균과 분산을 구하는 것은 원래의 값보다는 원래의 값에 붙어있는 지수에 대해 평균과 분산을 구하는 것이 된다. 물론, 지수함수와 로그함수는 원래의 수가 커지면 함수값도 커지는 Definitely increasing 함수들이기 때문에 이렇게 하는 것이 원래 값들의 경향성을 바꾸지는 않는다. 하지만 지수에 대해 분석하는 것과 원래의 값에 대해 분석하는 것은 그래프를 그려보면 원래의 그래프와 비교해서 왜곡이 생긴다는 것을 알 수 있다.

로그 그래프를 그려서 비교하는 이유는, 가령 어떤 현상이 지수함수적인 경향성을 갖고 있을 때에나 가능하다. 즉, 예를 들면 측정값이 1000이 나오는 경우가 10번에 1번, 100이 나오는 경우가 20번에 1번, 10이 나오는 경우가 30번에 1번 등으로, 그런 경향성이라면 측정값에 로그를 취해서 측정값의 지수와 출현 빈도를 비교하는 것이 좋다. 그런데 솔직히 말해서 친구가 물어본 위와 같은 경우에는 로그를 취하는 것이 통계적으로 큰 의미가 없다. 단지 그래프의 왜곡을 통해서 오차 범위가 작아 보이도록 하는 효과가 있을 뿐이다.

어쨌거나 이렇게 해도 오차가 그다지 줄어들지는 않기 때문에 그 친구는 그냥 원래 값 그대로 그래프를 그리고 실험 결과 분석에는 그냥 적당히 억지를 썼다는 허무한 결말로 이 글을 마친다.

실험 결과를 분석하기

이 글은 별 의미 없다. 기록해두려고 작성한다.

친구가 실험실에서 얻은 결과를 분석하는데 어떻게 해야 할지 모르겠다고 나에게 구원 요청을 해 왔다. 어떤 실험인가 하면, A라는 약품의 효과를 샘플에 주입해서 샘플에서 나오는 빛의 양을 측정하여 알아내는 실험이다. 즉, 가정은 A물질을 샘플에 투입한 양과 샘플에서 나오는 빛의 밝기 I사이에 상관관계가 있다고 주장하는 것이다. 그리고 이 실험을 진행하면, A물질을 샘플에 투입한 후 지난 시간에 따라서도 빛의 밝기가 변한다.

이걸 의미있게 분석하기 위해서 통계적으로 가설 검증을 한다. 실험 결과의 분석은 다음과 같다. A물질을 샘플에 투입하기 전의 빛의 밝기를 Baseline으로 잡는다. 즉, 그만큼은 원래 있었다는 뜻이다. 그리고 A물질을 샘플에 투입한 직후의 밝기를 Initial으로 잡는다. 시작할 때 값이라는 뜻이다. 이래 놓고서 시간에 따른 빛의 밝기를 측정한다. 시간에 따라 밝기는 대체로 어두워지는 편이다.

모든 과학적인 실험은 반복성, 재현성이 있어야 하기 때문에 동일한 샘플을 만들어서 동일한 양의 A물질을 투입하고 동일한 실험을 하였다. 하지만 샘플이 사실은 생물학적 샘플이다 보니 아무리 조건을 동일하게 하더라도 결과가 조금씩은 달라지고, 눈에 드러나는 반복성은 A물질이 많이 들어갈수록 Initial이 더 커진다는 것과 시간이 지날수록 밝기가 어두워진다는 것 정도이다. 이정도는 통계적 검증을 하지 않고 주관적으로 말할 수 있는 사실이긴 한데, 문제는 통계적 검증을 해야 논문을 쓸 수 있다는 것이다.

하지만 매번 같은 실험을 하더라도 Baseline도 바뀌고 Initial도 바뀌기 때문에 어떻게 할 수 없는, 그런 문제가 발생했다. 1번 실험과 2번 실험을 합쳐서 통계적 유의미함을 얻어낼 수가 없다. 생물학적으로 바뀌는 부분을 보정해 줘야 이 실험이 어떤 유의미함을 갖게 될 것이다. 그래서 내가 제안한 방법들은 다음과 같다.

1. Scaling은 어떨까?

실험이 어떻게 되는진 정확히 모르겠지만, 1번 실험과 2번 실험에서 얻은 각 측정값에 어떤 상수 a를 곱해주면 같은 경향이 되지 않을까? 하지만 Baseline의 비율이나 Initial의 비율 중에 하나를 기준으로 삼아야 하는데, 어떤걸 기준으로 삼아도 그 이후의 경향성을 제대로 분석할 수 없다는 결론을 얻었다.

2. 그냥 빼버리면?

비율은 상관 없이 각 실험의 측정값들이 어떤 상수 a만큼만 차이가 있다면? 이것도 바로 기각되었는데, 그래프 생긴게 “시간이 지날수록 어두워진다”는 경향성만 같을 뿐 수치상으로는 별 관련이 없었다.

3. 1번과 2번을 다 합쳐서 Y=aX+b의 관계가 있는건 아닐까?

역시 계산해봤는데 별 관련이 없었다.

4. 푸리에 변환을 해보면 주파수 영역에서 뭔가 관련성이 나오지 않을까?

푸리에 변환을 하고 싶었는데 점이 8개밖에 없어서 분석이고 자시고 할 게 없었다.

5. Y=f(X)의 관계가 있다 치고 그걸 찾아내는건 어떨까?

무슨수로…-_-;

6. Convolution을 공부해서 해보자.

그 친구에게 Convolution을 가르치는건 뭐 어떻게 한다 쳐도, 그 논문을 읽고 심사할 그 분야의 다른 연구자들까지도 Convolution을 잘 알거라고 크게 기대하기 힘들다. 그리고 어쨌든 Convolution은 그 분야에서는 잘 쓰는 방법은 아니라고 하더라.

그래서 그냥 그 친구는 아무런 보정도 하지 않고 그냥 평균을 냈다.

나만 허무했지 뭐.

Desire에서 블투 키보드 쓰기

언젠가 쓰고 말테다. ㅋㅋ 원래 스마트폰을 산 이유가 아주 작은 워드프로세서를 목적으로 하고 있었으니까.

델에서 뭔가 내놨다


http://www.talkandroid.com/4181-dell-streak-works-with-bluetooth-keyboard-and-mouse/

루팅하면 뭔가 된다고 한다.


http://forum.xda-developers.com/showthread.php?t=715913

오늘의 실험 일지

어제…로군.

1.

같이 일하는 직원이, 내가 합선시켜서 50만원짜리 모터 드라이버 날려먹은 것과 비교도 안되는 대형 사고를 쳤다. -_-;

그 자세한 내용은 너무 참혹해서 블로그에는 밝힐 수 없지만, 어쨌든 실험을 완전히 처음부터 다시 시작할뻔 했다. 궁금한 사람은 전화로 문의.

2.

오늘은 하루종일 납땜만 했다. 사실 납 연기는 살짝 달콤한데, 절대로 들이마시지 말아야 한다. 중독된다. -_-;


http://www.vitaminmd.co.kr/dic/disease/harvard/view.md?diseaseid=000aC


방독면 쓰고 작업해야 하나요…

근데 집에 와서도 납땜 생각이 나는건 이거야말로 납 중독인가.

3.

오실로스코프가 고장났다. 젠장. 1초에 20억번 측정할 수 있는 놈인데 AS받아야 한다. 언제 켰는지는 모르지만, 내가 지난번에 켰을 때는 멀쩡했는데, 2주 전에 실험에 쓰려고 다른 박사님이 켰을때 이미 정신줄을 놓은 상태였다고 한다.

4.

DC 5V-30A를 공급할 수 있는 실험실용 전원 공급기를 사려고 부산에 있는 업체에 전화를 걸었다. 아니, 솔직히 말하면 그 업체 홈페이지에 견적 요청을 했다. 견적 이메일이 그 다음날 오고, 거의 동시에 업체에서 전화가 왔다. “안녕하십니까, xxx의 대표 xxx입니다”

난 그냥 말단 직원인데…;;;; 대표님이…

어쨌든 구입하긴 할건데, 그분이 너무나 “제발, 제발 사셔야 해요”라는 자세로 나와서 내가 당황했다. 물건이 거의 안팔리다가 몇달만에 연락이 온거 아닐까 싶을 정도로.

5.

새로 꾸미는 실험실에 들어갈 모터를 컨트롤 하는 프로그램과 그 컨트롤러를 제작하는 회사 아저씨가 계속 납품을 미룬다. 이 모터가 내가 2번에서 납땜한 그 모터다. 나도 계속 늦춰져서 내가 나갈때까지 납품이 안됐으면 좋겠지만, 그건 아직 17개월이나 남았기 때문에 그 전에 내가 개갈굼 당하고 결국 일을 하게 될 것이다. 그런 사태를 미연에 방지하기 위해서는 그 아저씨가 좀 잘해줘야 하는데… 그분도 “을”의 자세를 철저히 견지하는 분이라 일정 지연시키기 신공이 장난이 아니다. 아…좀 난 “갑” 체질이 아니란 말이지.

6.

이제 실험결과를 자동으로 분석하는 프로그램을 만들어야 한다. 안그러면 난 400개의 그래프를 또 그려야 할지도 모른다.

7.

휴가는 8월 첫주에 냈다. 그리고 8월 6일이 졸업논문 마감이다. 근데 2, 3, 4일에 뭔가 약속이 있을 것 같다. 그래서 5일날 벼락치기로 쓰든가, 아님 이번 주말과 다음주 주말에 다 쓰든가 해야 한다. 부디 그 사이에 실험실에 별일이 없어야 하는데…

8.

점점 양성자 실험일이 다가오고 있다. 문제는 실험이 언제 시작할지 확정되지 않았다는 것. 이번 실험 결과가 잘 안나오면 양성자 실험으로 바꾼다는데, 이번 실험 결과가 잘 나올때까지 실험 하라는 소장님의 지시사항이 있었으니, 양성자 실험을 안한다는 것 같기도 한데, 그렇다고 준비 안하고 넋놓고 있다가 실험 하겠다고 하면 어쨌든 손해보는건 나다. 하지만 준비 열심히 해놨는데 이번 실험 결과가 잘 안나오지만 잘 나오게 될 것 같은 느낌이 든다면서 이번 실험이 연말까지 계속되진 않겠지만 연말까지 계속되면…

괜히 서둘러서 준비하고 야근한게 되는 거라, 역시 손해보는건 나다.

뭐… 그래도, 성과급은 그럭저럭 잘 나오는 것 같으니까 손해는 메꿔지는 것 같기도 하고…

9.

일기가 길어지고 있는건 그만큼 요새 맡게 되는 일들이 다양해진다는 뜻이다. 다음주에는 CCD의 전원 공급기 모듈, 9핀 시리얼 케이블의 역접속 상자를 만들어야 한다. 여기서, 역접속이란 12345번 핀이 54321번 핀으로 연결되고, 6789번 핀이 9876번 핀으로 간다는 뜻이다. 혹시 독자 중에서 이런식으로 연결된 케이블이나 젠더 체인저를 파는 업체를 알면 댓글로 알려주시기 바란다. 진짜 한턱 쏠 수 있다. 주말에 직접 가서.

10.

나머지 일기는 다음 사건이 터지고 나면.

사고좀 그만 치자. (사고가 없으면 일기도 없다. -_-;)

11. 추가.

까먹을뻔 했다. 오늘은 하루종일 사포질 했다. 알루미늄 판을 거울처럼 만들어야 한다.

뭔 일들이 다들 정신줄 놓고 해야 하는 단순 작업들인가…

안장점 찾기

안장점 찾기는 매우 흥미로운 주제이다. 왜냐하면, 내 졸업논문 주제가 안장점 찾기 알고리즘을 비교하는 것이기 때문이다. 다른 사람에게는 흥미롭지 않을지도 모르지만 어쨌든 찾아보자.

우선, 안장점이 뭔가에 대해서 알아야 한다. R이 위치를 나타내는 벡터라 치고, f(R)=z인 어떤 그래프가 있을 때, 안장점은 R의 어떤 방향으로는 극대값이고 다른 어떤 방향으로는 극소값을 갖는 지점이다. 어떤 방향으로 극대값인데 그 방향으로도 극소값을 갖는다면 그건 그 방향으로 상수함수니까 별로 중요하지 않다. 이 안장점을 찾아야 하는 이유는, 내가 졸업논문에 안장점 찾기 알고리즘을 쓰기로 했기 때문만이 아니라, 여러가지 물리적인 현상을 컴퓨터를 이용해 계산하는데 있어 안장점이 중요한 역할을 하기 때문이다. 어떤 물리적인 계가 항상 바닥 상태에만 있다면 그 물리계를 나타내는 상태 함수를 찾아낸 후, 그 상태함수의 극소값을 다 찾아내면 된다. 극소값을 찾아내는 문제는 고등학생이면 다 알다시피 미분해서 0되는 지점을 찾아내는 것이다. 그런데, 미분해서 0이 된다고 다 극소값은 아니다. 물론, 미분해서 0이 되는 지점을 다 찾아낸 후, 그 지점 각각이 극소값인지 극대값인지 아무것도 아닌지 알아내는 것은 매우 쉽다. 그런데 항상 바닥상태에만 있다면 아무 일도 일어나지 않을 것이고, 아무 일도 일어나지 않는 세계는 우리가 사는 세상이 아니다. 알다시피 매일 사건이 터지는 곳이 바로 현실이다. 즉, 바닥상태에서 다른 곳으로 움직이는 것을 예측해야만 하는데, 물리적인 계는 다른 곳으로 움직일 때에도 웬만하면 가장 에너지가 낮은 곳으로 움직이려고 하기 때문에 에너지가 가장 낮은 경로를 따라서 움직인다. 다만, 바닥상태는 아니니까 한쪽으로는 점점 위로 올라가는 것이다. 한없이 올라갈 수는 없으므로 언젠가는 다른 바닥상태에 도착할 것이다. 즉, A에서 B로 가는 방향인데 가면 갈수록 점점 올라가긴 한다. 하지만 원래 가는 방향이 아닌 다른 방향으로 가면 더 힘들다. (극소점) 그리고 바닥에서 다른 바닥으로 가는 거니까, 올라가다가 언젠가는 내려가야 하고, 따라서 어딘가에서는 극대값을 갖는다. 바로 이 지점, 극소값이면서 극대값을 갖는 지점이 안장점이다.

우리가 관심을 갖고 있는 물리적인 계가 여기서 저기로 움직일 때 어느 곳을 통해서 가는지 알아내려면 안장점을 알아내야 한다. 이것이 안장점이 흥미로운 이유다. 물론 내가 졸업논문에 쓰기로 했으니까 더더욱 흥미로운 주제가 된다. 만약 이 주제가 흥미롭지 않다면, 당신은 내가 아니라는 것이 증명될 뿐이다.

아무튼 원래 문제는 극소값이 아니라 안장점이므로.

안장점은 어떤 방향으로는 극대값이고 다른 방향으로는 극소값이 되는 지점이기 때문에, 그 지점에서 함수를 한번 미분하면 0이다. 고등학생이라면 … 다 아는 얘기니까 하는 거지만, … 두번 미분했을 때 그 값이 음수라면 위로 볼록한 부분이고 양수라면 아래로 볼록한 부분이다. 두번 미분했을 때 0이라면 끔찍한 일이 벌어진다. 평평하다. -_-;

안장점의 예


http://www.google.com/images?um=1&hl=ko&client=ubuntu&channel=fs&biw=1276&bih=713&tbs=isch%3A1&sa=1&q=saddle+point&aq=f&aqi=&aql=&oq=&gs_rfai=

어쨌든 안장점인지 아닌지 알아내기 위해서는 이게 오목하지도 않고 볼록하지도 않다는 걸 확인해야 하므로 항상 두번 미분해야 한다. 그런데, y=f(x)같이 1차원에서 1차원으로 가는 함수면 과학자들이 고민하지도 않을 것이다. 과학자들이 풀고 있는 문제는 임의의 n차원에서 n이 300000000000000000000000정도 되는 경우에 안장점을 어떻게 찾을 것인가 하는 문제이다 물론 이건 너무 복잡하니까 이보다 10억배 정도 쉬운 문제인 n=300000000000000 차원 정도에서 풀려고 하는데 그래도 복잡하니까 다시 1000만배 정도 쉬운 문제인 n=30000000차원 정도의 문제를 풀려고 한다. 물론 사람이 계산할 순 없다. 돈 아무리 많이 줘도 이짓은 못하겠다. (옛날엔 했다. 케플러가 살던 시절에는.) 그럼, 여기서 2차 도함수를 계산한다면, 1차 미분한 각각의 함수의 1차미분이니까, 다시 계산해야 하는 수가 900000000000000개가 된다. 하지만 이건 안장점을 알고 있는 경우에 그 점에서 계산해야 하는 수의 개수이고, 어디있는지 모르면 그 안장점을 찾아 헤매이면서 모든 점에서 다 해봐야 안다. 즉, 이건 컴퓨터조차 파업할만한 문제다. (파업하는 컴퓨터가 있다면 그 컴퓨터는 고장났거나, 미래에서 왔을 것이다.)

그래서 컴퓨터에게 삽질을 떠넘기고 그 사이에 편히 쉬면서 좀 더 유용한 일을 하려는 전산물리학자들은 두번 미분 할 필요 없이 한번만 미분해서 문제를 해결하는 방법을 찾아내기 시작했다. 그것이 내 졸업논문에서 다루려고 하는 Stability Boundary Method와 Dimer Method와 Nudged Elastic Band Method이다.

자, 일단 여기까지. 각각의 알고리즘에 대한 자세한 설명은 다음 기회에…

예정

블로그에 써보고 싶은 글들의 목록을 정리해 둔다.

엔트로피의 이해 – 이제 수식없이 이해하는 시리즈는 그만 두고, 그냥 이해하는 시리즈를 쓸 생각이다. 어떤 댓글을 보고, 굳이 수식을 없애야 하는 필요성을 못 느끼게 되었다.

비상대론적 양자역학 – 학부 수준의 양자역학을 이해하는 글을 써 볼 생각이다. 왜냐하면…

상대론적 양자역학 – 대학원 수준의 양자역학을 잊어먹고 있어서, 다시 기억을 되살리려면 이 글까지 써봐야 한다. 복습.

파인만의 경로 적분 – 상대론적 양자역학을 배운 후, 양자장론을 배우게 되면, 한두개의 입자를 갖고 계산하던 걸 무한히 많은 조화 진동자로 바꿔서 계산해야 한다. 파인만은 이걸 그림으로 그려서 조금 쉽게 이해 했는데, 이게 와전되서 적분이 쉬워졌다고 착각하는 일반인도 있다. 솔직히 말해서 이해하기만 쉬워진거지 적분 자체는 그대로다. 다만 어떤걸 적분하고 어떤건 계산할 필요가 없는지 구별하기가 쉬워졌기 때문에 이건 혁명이라고 해도 과언이 아닐 것이다. 어쨌든, 이론물리학을 공부한 대학원생이라면 전공을 막론하고 대강 할 줄 알아야 하고, 내 지도교수님도 아마 내가 이 계산을 할 수 있을거라고 생각하시겠지만, 사실 못한다. -_-; 적분식 쓰는 것 까진 대강 이해했는데, 아직 적분을 해본 적이 없다. 그래서 도전할 과제는 e-e 충돌과정의 계산.

경로적분까지 가려면 엔트로피, 양자역학, 양자장론을 거쳐 가야 하기 때문에 몇달 걸릴것 같다.

그리고 그보다 가장 먼저, 안장점 찾기 알고리즘에 관한 글이 몇가지 올라갈 것이다. 이건 방통대 졸업논문때문에 공부해야 하는데, 이제 졸업논문 제출 기한까지 2.5주 남았다. 8월 6일까지 제출 못하면 졸업이 1년 늦어진다.

그 외에 공부한 것들에 대해서도 글이 올라갈 예정이다. 실험일지도.