블로그

  • 묘한 스팸

    블로그 하다 보면 스팸이 달리는 일은 언제나 있는 일이고, 자동 시스템이 그 스팸들을 휴지통으로 보내는 일도 언제나 일어나는 일이다.



    가끔 휴지통에 뭐 들어가 있나 살펴보면, 그중에서도 가끔 흥미로운게 나타난다.

    차가운 나를 움직이는 너의 미소, 지독한 내게 의미를 준 너의 사랑, 미안 미안 내 가슴아는 모두 노래 가사에서 갖고 온 문장들이다.

    네번째 문장이 매우 흥미롭다. 기계로 된 번역을 갖고 온 것 같은데, 정말 멋진 말이 있다. “학습은 천하무적 할 것입니다” 그렇다.

    학습은 천하무적이다.

    그 다음 문장도 가히 절묘하다. 행운만이 개인 능력. 당신이 일생동안 도와드릴까요? 평생 할 수 없습니다. 너무 가슴이 아파 목이 메이는 문장이다.

    행운만이 개인의 능력이다.

    아아…

    그리고 세계는 절대적으로 공정하고 공평. 그런데 요점은 그게 아니다.

    마지막 문장도 다시 노래 가사에서 갖고 온 문장이다.

    아무튼 요새 스팸들은 정말 기가막힌 문장으로 사람들을 유혹한다.

  • 서러운 자연대생


    http://news.naver.com/main/read.nhn?mode=LSD&mid=shm&sid1=102&oid=005&aid=0000548942

    이공계 전공자의 취업이 매우 힘들고, 취업이 되더라도 낮은 임금수준에 괴로워 한다는 이야기가 돌고 있다.

    기사로 나왔길래 물리학과는 어떤가 봤는데 기사에 아예 언급조차 되어 있지 않았다.

    그래서 직접 찾아봤다.


    http://www.krivet.re.kr/ku/da/prg_kuBHBVw.jsp?pgn=&gk=&gv=&gn=E5-E520130006

    여기 가보면 보도된 내용의 원본 자료가 있다.

    위의 자료에 따르면…

    1. 자연계열은 공학계열에 비해 전반적으로 취업 상황이 나쁘다.

    2. 자연계열 중 물리는 77.8%, 수학은 78.8%의 취업률을 보이고 있다. 반면 화학은 64.5%, 생물은 66.4%의 취업률을 보이고 있다. 이걸 평균하면 자연계 전체가 73%인데, 이것만 보고 자연계열 취업이 안된다고 판단하는 것은 무리인 것 같다.

    3. 물리와 수학은 일부 공학계열보다 취업률이 높지만, 그럼에도 불구하고 임금수준은 낮은 편이다.

    4. 전반적으로 괜찮은 일자리 비율이 줄어들었지만, 물리는 괜찮은 일자리 비율이 아주 쥐꼬리만큼이긴 하지만 올라갔다.

    음… 이걸 물리 전공자인 나는 좋은 신호로 보아야 하는 것인지 모르겠다. 어쨌든, 물리나 수학 전공자가 화학이나 생물학 전공자보다는 전망이 나쁘지 않다는 뜻으로 해석해야겠다. 물리 전공자의 눈에서 사심과 편견을 가득 담아서 소개하였으므로 관심있는 사람은 원문을 다 읽어보기를 권한다.

  • Just begun

    하야시바라 메구미 13집에 실린 노래.

    長い長い旅の終わりに 길고 긴 여행의 끝에
    伝えたいことがあふれている 전해주고 싶은 일들이 넘쳐나는데
    うまく言葉にできなくたって 갑자기 말이 잘 나오질 않지만,
    大丈夫 伝わるよね 괜찮아. 전해지겠지

    迷わずただ信じ抜くこと 헤메지 않고, 단지 믿어준다는 것
    自分の弱さに打ち勝つこと 자신의 약함을 딛고 승리한다는 것
    出来そうで出来なくてやりのけて 할 수 있느냐 없느냐는 상관하지 않고
    そのくり返しが道になる 그렇게 계속하다보니 길이 되었어

    いつか大人になったその日に 언젠가 어른이 되는 그 날에
    今日をどう思うのだろう 오늘은 어떤 추억이 되어 있을까
    楽しい事も 즐거운 일들도
    つらかった事も 괴로운 일들도
    きっと輝いてるだろう 분명 빛나고 있을 거야

    今日に負けない自分でいよう 오늘에 지지 않는 내가 되자
    人生(たび)はまだ途中だから 인생은 아직 끝나지 않았잖아
    楽しい事も 즐거운 일들도
    ちょっとつらい事も 조금 힘든 일들도
    これからも続くのだろう 지금도 이어지고 있는걸
    そうずっと続いてく 그래. 계속 이어질거야

    一生懸命からまわり 목숨을 걸고, 헛수고 하고
    何が駄目なのかもわからない 뭐가 안된다는 것도 모르고
    それでも出口はどこかにあると 그런데도 출구는 어딘가 있다고
    あがいては抱え込んで 발버둥 치는건 익숙해졌는데

    一人じゃ何も出来ないって 혼자서는 아무것도 할 수 없고,
    認めたくはなかったんだけど 인정받지는 못한 것 같지만
    頼ること そして 頼られること 남을 믿고, 그리고 나를 믿어주고
    そこから力は生まれる 거기서부터 힘이 생겨나지

    どんな大人も遠回りして 어떤 어른이라도, 헤메다 보면
    きっと答探してる 반드시 해답을 찾아내지
    自分のために 자신을 위해서
    誰かのために 누군가를 위해서
    時には背伸びさえして 때로는 무리해서라도 해내야돼

    ただ勝つために 단지 이기기 위해서
    進むわけじゃない 앞으로 가는 것이 아니야
    負け越した傷跡さえ 패배에 상처를 받은 것 조차
    次の課題(チャンス)に向き合うための 다음 기회로 향해 가기 위한
    運だめし 力だめし 단계가 되고, 힘이 되고
    そうただそれだけのこと 그렇게 단지 그뿐이지

    いつか大人になったその日に 언젠가 어른이 되는 그 날에
    今日をどう思うのだろう 오늘은 어떤 추억이 될까
    楽しい事も 즐거운 일도
    つらかった事も 괴로운 일도
    きっと輝いてるだろう 분명 반짝이게 될 거야

    今日に負けない自分でいよう 오늘에 지지 않는 내가 되자
    人生(たび)はまだ途中だから 인생은 아직 진행중이니까
    楽しい事も 즐거운 일도
    ちょっとつらい事も 조금 힘든 일도
    これからも続くのだろう 지금도 이어지고 있어
    そうずっとずっと続いてく 그렇게 계속, 계속해서 이어질거야

    해석은 80%정도 맞는 것 같고 나머지는 대충 의역해보았다.

    역시 언제나 힘을 얻을 수 있는 메구미의 노래들이다.

    사실 이 곡은 Give a reason 시절의 노래에 비해서는 많이 약해진 편이다. 당시의 노래들이 끝없는 힘과 용기를 추구하는 마음으로 썼다면, 최근에 Plenty of grit이나 이 Just begun같은 곡들은 인생을 길게 보라는 관점에서 의지를 심어준다. 늙어 가는 사람들은 다들 비슷한 생각을 하는가보다.

    살다보면 성공할 수도 있고 실패할 수도 있다. 그 하나하나가 자신의 인생이고, 죽을때 까지 이어지고 있는 이야기의 클라이맥스다. 현재에 몰입하자. 이 뜻은 현재에 충실하자는 것과 조금 다르다. 현재에 충실하지 않더라도, 자신이 현재에 충실하고 있지 않다는 사실을 잘 알고 적당할 때 빠져나올 수 있다면 현재에 몰입한 것이다.

    내가 나의 인생을 선택하여, 죽을 때는 후회하더라도 지금은 후회하지 않는 순간을 보낸다면, 사실 미래를 모르는 입장에서 그렇게 살 수밖에 없겠지만, 그게 좀 더 재미있는 인생 아닐까. 어차피 오랜시간동안 수많은 고민을 해도 선택은 찰나의 순간에 이루어진다.

  • 숙제하다가…

    양자장론 숙제하다가 찍어봤다.



    위에 한장 있는건 숙제고, 왼쪽 여섯장은 잘 정리해 둔 것, 오른쪽 네장은 진행중인 적분이다. 오른쪽 네장을 왼쪽처럼 잘 정리하면 10장 정도로 요약될 것 같은데, 그리고 최종적으로 두세장 정도 더 쓰면 숙제가 완성될 것 같다.



    분명 교과서에서는 두 줄 정도로, 계산해보면 나온다고 해서 시작한 숙제일텐데, 왜 길이가 발산하고 있는건가.

    역시 이론의 세계는 넓고 깊다.

  • 물리학과 진학 상담

    며칠 전 상담한 학생에게 답변해준 내용. 상담 신청하는 사람들이 점점 많아지는 것 같은데, 아무래도 상담 카테고리를 하나 만들어야겠다. 물론 상담 요청은 언제나 환영이다.


    일단 결론부터 요약해서 말하자면, 물리학과 가도 됩니다.

    취업 생각해도 물리학과 가는것이 도움이 됩니다. ‘취직
    잘되는 학과’에 가는 것이 도움이 되지 않겠느냐는 어른들의 조언이 있을텐데, 물리학과 취직 잘 됩니다. 물리학과의 장점이 기계과나
    전자과 같은 공대보다, 졸업하던 시점에 실력은 부족할 수 있어도 배우는 속도가 월등히 빠르기 때문에 취직 후에 금방 따라잡고 더
    뛰어난 일을 할 수 있다는 것이죠. 이건 회사 들어간 후 무슨 일을 하더라도 다 적용됩니다. 상품 개발, 설계, 컴퓨터
    프로그램, 영업, 인사, 마케팅, 홍보, 분야를 막론하고 물리학 전공이라는 것은 장점이 돼요. 왜냐하면 물리학과에서 배우는 것은
    복잡한 세상의 복잡한 문제를 단순화 시켜서 해결하고, 이 단순한 문제를 발전시켜서 복잡한 문제에 적용하는 기법을 배우거든요.

    물론 다른 학과에 가는 것도 나쁘지는 않아요. 취직 측면에서 봤을 때. 그런데, 어차피 전공 못 살려서 취직할 거라면 어느
    학과를 가든 상관 없을 거예요. 그런데 물리학과는 어디서 무슨 일을 해도 거의 다 잘해요. 이건 두가지 이유가 있는데, 앞에서
    말한 대로 물리학 자체의 특징이랑, 두번째로는 물리학과 출신들은 세상에 물리학보다 어려운 것이 없다는 사실을 잘 알기 때문에 그
    외에 나머지는 다 쉽게 생각할 수 있다는 점이죠.

    공대 가더라도 물리학은 기초적인거 다 배워야 해요. 그만큼 물리학이 기본이라는 거죠. 졸업할 때 쯤 돼서 대학원 갈 생각이
    없어지더라도 취직에 치명적인 것은 아니고, 다른 전공자들과 비교해서 불이익 받을 점도 없으니까 물리학과 진학한다고 해서 취업을
    걱정할 필요는 없어요.

    취업 얘기는 이쯤에서 끝내죠. 어차피 취직하려면 빨라도 5년 후에나 할 텐데, 지금 시점에서
    취직 걱정하는건 너무 일러요. 그때 가서 어느 학과가, 어느 전공이, 어느 분야가 유망할 것인지 말하는 것은 위험해요. 물리학과는
    매우 기초적인 분야라서 그때쯤에 어떤 분야가 유망하더라도 다 비집고 들어갈 수 있다는 점만 기억해 두죠. “당연히 할 수
    있습니다”가 되는 그런거요.

    그 다음, 물리학과에서 뭘 배우느냐는 건데요, 솔직히 쉽지는 않아요. 일단 뭐가 어려운지 얘기를 먼저 하고, 어떻게 공략하면 되는지 설명할게요.

    대학교 1학년때의 일반물리는 물리2를 확장한 부분이라 물리에 관심이 있었다면 할만할 거예요. 실제로 어려워지는건 2학년때 전공 과목을 배우면서부터인데요, 본격적으로 어려워져요. 심지어, A+을 받아도 뭐가 뭔지 이해
    못하고 졸업하는 사람도 있어요. 고전역학, 전자기학, 열/통계역학, 양자역학, 이렇게 네 과목을 4대역학이라고 해요.
    상대성이론은 아쉽지만(?) 정식으로 과목이 개설되는 것은 대학원 때네요. 특수 상대성 이론은 고전역학의 끝, 전자기학의 끝에서
    잠깐 배우는데 교수님에 따라 강의 안하고 건너 뛰는 분도 많아요. 일반 상대성이론은 대학원 수준이라 이거 배우려면 박사과정에
    진학해야돼요.

    왜 어려워지냐하면, 본격적으로 개념들이 추상화되기 시작하거든요. 고등물리2나 일반물리학 까지만 해도, 실제로 공을
    던지거나, 회로의 저항을 본다거나, 압력과 온도를 잰다거나, 이렇게 실생활에 익숙한 개념들을 이용해서 문제를 내고 풀고 하잖아요.
    전공 과목에서는 이런 개념들을 전부 다 추상화해요. 즉, 눈에 보이고 손에 잡히던 물리에서 상상조차 잘 안 되는 개념으로
    발전한다는 거죠. 이 부분을 고등학교에서 생각하던 그것과는 다르다고 말하는 건데요. 음, 뭐랄까, 쉽게 말해서, 요새 고등학교
    교과서에 파인만 다이어그램이 나온다던데, 그 교과서에 실린 파인만 다이어그램을 실제 우리가 아는 숫자로 계산하려면 A4용지로
    수십장 정도의 적분 계산 과정이 필요하다는 거죠. 그런데 그 적분이 필요하다는 얘기는 빼버리고 “파인만 다이어그램 덕분에 계산이
    쉬워졌다”는 말만 하고 있으니, 당연히 대학에 가서 기대하던 것과 다르죠. 그게 그렇게 쉬웠으면 파인만이 노벨상을 받았겠어요?
    심지어 슈윙거랑 도모나가는 그거 안쓰고 계산한 천재들인데요.

    하지만 물리학의 본질은 사라지지 않아요. 아무리 어려운 계산과 개념이 난무해서 멘탈을 난도질 해도, 최종적으로 얻게 되는
    숫자는 우리가 실험에서 측정할 수 있는 그 수치거든요. 가령 옴의 법칙이 대학에서는 벡터 미분 연산자 형식으로 얻어지는데, 이걸
    이용하면 위치마다 다른 전류와 저항값을 구할 수 있어요. 고등학교 때에는 덩어리의 저항을 얻었다면, 대학에서는 그 덩어리의 각
    위치마다 저항이 어떻게 다른지를 알 수 있다는 거죠. 최근에 LHC에서 얻은 힉스 입자의 발견도 마찬가지로, 앞에서 말한 수십
    수백 페이지의 적분을 해서 얻은 결과를, 입자 검출기에서 나온 수치와 비교해서 딱 맞아 떨어졌기 때문에 “발견했다”고 말할 수
    있는 거거든요. 이 맛에 물리를 하죠. 다른 학문이 따라 올 수 없는 그 맛. 화학이나 생물은 이론과 실험 중 실험이 훨씬
    중요하고, 수학은 오직 이론만이 있잖아요? 물리는 이론으로 설명할 수 없는 실험 결과는 그냥 레포트고, 실험 결과를 설명하지
    못하는 이론은 쓰레기이기 때문에, 이론과 실험이 항상 같이 맞아 떨어져야 하고, 실험을 설명하는 이론을 만들어 냈을 때, 또는
    이론이 아직 설명하지 못한 결과를 얻어냈을 때의 성취감은 정말 비교할 수 없다고 봐요. (물리학과니까, 찬양좀 할게요. ㅎㅎ)

    그럼, 대학에서는 도대체 뭘 배우는가? 그건 이 글을 참고해 주세요.


    http://snowall.tistory.com/9

    그 다음…


    이언스 캠프 같은데서 박사들이 강의한 내용을 주변 친구들이 다 이해한 것 같아 보였나요? 장담컨대, 그중 95%는 이해한 척 한
    친구들이고, 나머지 5%도 다 이해했다고 착각하는 친구들일거예요. 전혀 걱정할 필요 없어요. 그리고 똑같이 다른 애들은 다
    이해했는데 나만 모르나보다 하고 생각하고 있겠죠.

    집안 형편은 제가 어떻게 해줄 수 있는 부분이 아니라 힘내라는 응원밖에는 해줄 수가 없네요. 다만, 잘 찾아보면 장학금
    주는데도 많이 있고, 카이스트, 지스트, 유니스트 같은 곳의 대학원은 학비가 100% 무료에 용돈도 주기 때문에, 실력만 있다면
    대학원 가는게 부담되지는 않아요. 언어에 소질이 있다고 했으니, 영어에 자신 있다면 유학을 노려봐도 되고요. 참고로 대학원 유학은
    무조건 장학금 받고 가는 거예요. 합격한다면 그건 장학금 줄테니까 오라는 뜻. 이쪽 진학 상담은 4년쯤 뒤에 다시 해줘야겠네요
    ㅎㅎ

    물리학과에 진학한다고 치고, 물리학과에서 공부를 잘 하려면 고등학교때 기초를 잘 해두는게 중요한데요, 고3이니까 이제 어쩔 수 없겠지만, 가능하다면 수학, 물리, 영어에 힘써야 해요.

    특히, 수학에서는 미분적분 부분이랑 행렬과 벡터 부분이 매우 매우 매우 (x1000) 중요해요. 물리는 당연히 중요하고, 영어는 2학년때부터는 전공 교과서가 거의 다 영어책이므로 중요해져요.

    저는 중앙대 물리학과에서 학사와 석사를 하고, 카이스트 대학원으로 왔는데요.

    처음에 물리학과 지원할 때는 밥 굶어도 하겠다고 해서 왔었어요. 와보니까 선배나 후배나 동기나 다들, 거의 대부분, 취직 하더군요. 심지어 성적이 그렇게 높지 않은데도 불구하고요. (물론 성적이 낮아도 된다는 건 아님.)


    등학생들이, 선생님이나 부모님들이 하도 명문대 가라, 유망학과 가라, 말을 해서 걱정스러울텐데, 그렇게 잘 아시는 그분들은 그
    학교 그 학과 가서 성공하시지 왜 그렇게 살고 계신가요. 미래는 어떻게 될 지 알 수 없고, 어른들의 경험도 결국은 10년 이상
    지난 해묵은 경험들이에요. 특히 유망 분야에 관한 경험은 더욱 그렇죠. 지금은 의사도 변호사도 월급쟁이에 영업 뛰는 세상이에요.
    어느 분야를 가든, 뭘 하든, 거기서 열심히 노력한다면 먹고 살 수는 있어요.

    고급 외제차 몰고 다니고, 백화점에서 물건 살 때 가격 신경 안써도 되고, 회사 가면 다들 90도 인사하는거 부러우면
    물리학과 오면 안되죠. 하지만 그냥 대충 먹고 살 정도로 벌면서, 연구하는거 좋아한다면, 물리학과에 오는것도 나쁜 선택은
    아니에요. 힘들지 않냐고요? 다른 직장, 어떤 직업도, 그만큼은 힘들어요. 세상에 돈 벌면서 안 힘든게 어딨나요? 있으면 좀
    알려줘봐요. 내가 하게.

    그리고 지금 잘하는 애들 부러워 하지 마세요. 아무리 머리가 좋아도 노력하는 사람을 이길 수는 없어요. 물론 노력형 천재는 못 이기지만, 그런 사람들하고는 친구 먹으면 되는 거고요.


    내가 재능이 없는건 아닐까?” 이거에 대해 고민해야 하는 나이는 29살이에요. 그때까지 해도 안됐다면 바꿔야겠죠. 하지만 19살에
    해야 하는 고민은 “내가 정말 하고싶은 것이 이것일까?”예요. 저는 석사 과정에서, 너무 힘들어서, 하루에 수백번씩 그만둘까
    말까 고민했어요. 스트레스성 편두통까지 찾아오고. 그래도 그만둬야 하느냐는 질문에 아무래도 해야겠다는 답을 하면서 버티고 여기까지
    왔네요. 저는 이제 30살이기 때문에, 이제는 재능 없어도 어떻게든 해내야 하는 상황이라, 못 바꿔요 ㅎㅎ

    이런 말이 있죠. 해도 병신, 안해도 병신이면, 해본 병신이 낫다고.

    아무튼간에, 이건 물리학과에 진학해도
    나쁠게 없다는 일방적인 이야기였으니까 다른 분들 조언과 상담도 모두 참고해서 결정하도록 해요. 인생은 아무도 책임져주지 않아요.
    부모님도 못 책임지고 선생님도 못 책임져요. 내가 잘못한게 없어도 책임져야 할 때도 있고, 억울해도 울 수도 없는 상황도
    나타나요. 그러니까, 알아서 잘 결정하도록 하세요. 물리학과 갔다가 망해도, 저 역시 책임 못지니까요.

    다음 글들이 참고해볼만 할 거예요.


    http://snowall.tistory.com/

    3288




    http://snowall.tistory.com/

    2735




    http://snowall.tistory.com/376



    http://snowall.tistory.com/

    1825




    http://snowall.tistory.com/

    1826




    http://snowall.tistory.com/

    2789

  • 통계 개념들

    사실은, 통계에 관하여 중요한 내용은 고등학교 수학에서 전부 배운다. 통계에서 가장 중요한 것은 평균과 표준편차를 이해하는 것인데, 워낙에 뒤에서 나오다 보니 거의 대부분의 사람들이 별로 의미있게 배우지 못하고 간다. 하지만, 고등학교에서 배운 수학 중에 실생활에 써먹을 수 있는 거의 유일한 내용이 통계이다. 행렬이나 이차방정식의 근의 공식이나 등식과 부등식 같은 내용은 수능에 많이 나오기 때문에 열심히 공부하지만, 정작 실제로 써먹을 수 있는 통계는 별로 공부하지 않는다는 사실이 슬프다.

    고등학교 때 까지 배우는 통계에서 중요한 개념은 도수분포표, 히스토그램, 평균, 분산, 표준편차 등이 있다. 나중에 대학에 가서 통계학을 좀 더 배워보면 상관계수, 유의미성, 오차, 6시그마, 이런 개념들이 나타난다. (뭐 아는 사람은 눈치챘겠지만, 개념들 중 몇개는 겹친다.)

    통계에 대하여 어려워 하는 사람들이 많은데, 통계를 고등학교에서 가르친다는 것은 어려운 내용이 아니라 누구나 알아야 하고 이해할 수 있는 과목이라는 뜻이다. 그러니, 이 글에서는 좀 더 쉽게 통계를 이해하는 방법을 생각해 보려고 한다.

    통계는, 정말 대충 말한다면, 수가 많은 집단의 특징을 한두개의 대표값으로 정리하는 것이다. 예를 들어, 학생 100명의 성적 자료를 갖고 있다고 하자. 그럼 아마 숫자 100개가 일렬로 늘어서 있을 것이다. 여기서 어떤 사실들을 알 수 있을까? 물론 학생 개개인의 성적은 잘 알 수 있다. 하지만 그런 집단들을 비교해야 한다면? 학생 100명의 영어 성적과 수학 성적을 비교해서 학생들이 어떤 과목을 더 잘하는지 알아내려고 한다면? 우리 학교 학생 100명과 저 학교 학생 100명의 성적을 비교한다면? 올해 성적과 작년 성적을 비교한다면?

    그때마다 100명의 성적을 일일히 다 대조하면서 비교할 것인가?

    100명인 경우에는 어떻게든 할 수 있다고 치자. 그 규모가 국가 단위가 되면 아무리 적게 잡아도 몇십만명에서 많게는 1억명까지도 된다. 사람에 대한 내용이 아니라 상품이나 실험에 관한 수치가 되면 억 단위를 넘어서 수천억이나 조 단위까지 갈 수도 있다. 이것을 일일히 다 비교해서 원하는 결과를 알아낸다는 것은 불가능하다. 그러나 숫자 한두개로 정리하여 비교한다면 너무나 간단한 일이 된다.

    어떤 집단의 대표값은 여러가지 개념이 있는데, 중앙값, 최빈값, 평균값이 있다.

    중앙값(median)은 값들을 순서대로 정렬했을 때 가운데 있는 값이다. 즉, 100명의 학생이 있다면 그중 50등의 성적이 중앙값이 된다. 중앙값은 전체 집단의 절반은 더 큰 값을 갖고 있고 나머지 반은 더 작은 값을 갖고 있는 특징이 있다.

    최빈값은 가장 자주 나오는 값이다. 가령, {1,1,1,2,3,4,5}라는 집합이 있으면 여기서 최빈값은 1이다. 물론 중앙값은 2가 된다.

    평균값은 다들 알다시피, 값을 다 더한 후 개수로 나누어 구한 값이다.

    사실 중앙값, 최빈값, 평균값 중 무엇을 대표값으로 쓸 것이냐는 집단을 연구하는 사람이 아무렇게나 정할 수 있는 것이다. 그럼, 평균값만 알면 되지 중앙값이나 최빈값 같은 다른 개념을 왜 알아야 하는 것일까? 그건, 어느 하나가 모든 것을 대변하지 못하기 때문이다. 가령, 100명 중 1명만 100점이고 나머지 99명이 1점인 분포에서는 평균은 크게 의미가 없다. 최빈값이나 중앙값이 더 의미가 있다. 예를 들어, 100명중 49명이 1점이고, 1명이 25점이고, 나머지 50명이 100점인 분포가 있다고 하면, 이 경우에는 중앙값이 25점이 되므로, 중앙값은 거의 절반이 1점이고 거의 절반이 100점인 전체 집단의 특성에 아무런 정보를 주지 못한다. 이런 특수한 경우가 있기 때문에, 통계는 항상 그 결론을 의심하고 살펴봐야 한다. 그리고, 앞서 말했듯 아무거나 정해도 되기 때문에 통계를 잘 아는 사람들이 원하는 결론을 내기 위하여 엉뚱한 것을 대표값을 정하는 경우가 있다. 가령, 최빈값이 적절한 경우에 평균을 사용하여 다른 결론을 낼 수도 있다. 그러므로, 중앙값, 최빈값, 평균값이 있다는 사실을 알아두고, 누군가 통계적으로 의미가 있다는 주장을 할 때, 항상 그가 이야기하는 값이 정말로 현실을 반영하는지 알아봐야 한다.

    평균값은 사실이지만, 그 수 하나만으로 나타낼 수 없는 많은 진실이 그 숫자 뒤에 숨어있기 때문이다.

    평균은 전체적으로 어느 값을 중심으로 뭉쳐있는지를 나타낸다. 중앙값, 최빈값, 평균값, 어느 것이든 집단이 어느 수 근처에 모여있는지를 나타내는 값이다. 하지만 그 근처에서 얼마나 뭉쳐있는지는 알려주지 않는다. 그 값을 중심으로 멀리 퍼져있는지, 가깝게 오밀조밀 모여있는지는 수치가 하나 더 필요하다. 그래서 나온 것이 분산, 표준편차, 범위, 사분위범위 같은 산포도 개념들이다.

    일단 가장 이해하기 쉬운 것은 범위(range)이다. 범위는, 말 그대로 가장 큰 값과 가장 작은 값의 차이이다. 그러나, 100명 중 99명의 1점과 1명의 100점이 있을 때, 범위가 99점으로 나오므로 이게 과연 이 집단을 잘 설명하는지는 의문이 된다. 물론 1점부터 100점까지 1명씩 다 있는 경우에는 범위가 매우 적절한 수치가 되겠지만.

    그래서 나온게 4분위범위이다. 4분위범위는 크기 순서대로 줄을 세웠을 때, 상위 25%와 하위 25%에 해당하는 수치의 차이이다. 쉽게 말해서 100명이 있다면, 25등의 점수와 75등의 점수 차이가 4분위 범위가 된다.

    범위와 4분위범위는 집단이 정규분포나 푸아송분포 같은 잘 알려진 분포와 다르게 이상할 때에도 적당히 사용 가능한 산포도이다. 이 범위들의 강력한 대항마로, 분산과 표준편차가 있다.

    분산은 쉽게 말해서 “편차 제곱의 평균”이다. 편차는 평균과 값 사이의 차이이다. 평균을 얻었으면, 값에서 평균을 빼서 얻는 것이 편차이다. 당연히 편차의 평균은 0이다. 왜 그런지 궁금하면 직접 계산해 보는 것이 더 빠를 것이다. 편차는 음수도 있고 양수도 있기 때문에 평균을 내면 0이 된다. 그래서, 음수를 없애기 위해서 제곱하고, 그것을 평균을 내서 분산으로 삼았다..

    분산은 제곱한 수들을 평균낸 것이기 때문에 단위가 평균과 다르다. 따라서, 단위를 맞춰주기 위해서 도입한 것이 표준편차이다. 표준편차는 분산의 제곱근이다. 다시 말해서, 표준편차를 제곱하면 분산이 나온다.

    표준편차는

    라는 기호로 쓴다. 이 기호는 “시그마”라는 그리스 문자이다. 맞다 그 6시그마의 그 시그마가 이 시그마이다. 표준편차의 6배까지 오차를 줄인다는 뜻이 6시그마 공정의 의미이다.

    표준편차는 무슨 의미일까?

    일단, 많은 과학자들이 인정하고 넘어가는 사실이 있는데, “웬만한 경우, 어떤 사건이 일어날 확률은 정규분포 곡선을 따른다”는 것이다. 정규분포 곡선은 함수로 치면

    이렇게 생긴 함수이다. e위에 있는 지수의 분모를 보면 시그마가 들어가 있는 것을 볼 수 있다. 그래프 생긴건 다음과 같이 생겼다.


    http://ko.wikipedia.org/wiki/%ED%8C%8C%EC%9D%BC:Normal_Distribution_PDF.svg



    그럼 어쨌든 생긴건 종 모양으로 생겼고, 끝으로 갈 수록 0에 가까워지는 모양이다.

    이게 왜 중요할까? 많은 일들이 이 그래프의 확률 분포를 따라 일어나기 때문이다. 저 그래프의 아래에 있는 영역의 넓이가 어떤 일들이 일어날 확률을 나타낸다. 그러니까, 평균을 중심으로 표준편차만큼 좌우로 퍼진 영역의 넓이는 전체의 68%이다. 이것은 어떤 실험을 하거나 어떤 현상을 관찰했을 때, 평균과 표준편차를 알고 있다면, 그 실험을 다시 했을 때 평균 근처의 값을 얻을 확률에 관한 이야기이다. 100번 실험했을 때, 그 중 68번 정도는 평균에서 1시그마 이상을 벗어나지 않는다는 뜻이다.

    2시그마는 95.5%, 3시그마는 99.7%, 4시그마는 99.99%, 5시그마는 99.9999%, 6시그마는 99.9999998%에 해당한다. 가령, 6시그마는 실험을 100000000번 해서 한두번 정도가 그 바깥으로 벗어난다는 뜻이다.

    하지만, 이것은 평균과 표준편차를 알고 있을 때의 이야기라고 했다. 사실 진짜 얘기는 지금부터인데, 많은 통계 결과가 표본에 대해서만 조사하지 전수조사는 하지 않는다. 여론조사에서 5000만명을 무슨 수로 다 조사하는가. 그 중 1000명 정도만 뽑아서 조사한다. 이 때 바로 “신뢰구간”이랑 “신뢰수준”라는 말이 나오는데, 이것이 바로 이 글에서 이해해야 하는 중요한 개념이다. 원래 이 얘기를 하려고 했는데 앞에서 뭔가 나도 잘 모르는 어려운 개념들을 설명할 수 밖에 없어서 힘들었다.

    신뢰구간은 평균이 그 안에 들어가 있을 구간이다. 신뢰수준은 평균이 그 안에 들어가 있을 확률이다. 가령, 여론조사에 관한 언론 보도를 보면 “표본수 1000명에 대해 조사하여 신뢰수준 95%수준에서 A후보에 대한 지지율이 45%에서 플러스 마이너스 3%포인트이다” 처럼 생긴 문장이 흔하게 보인다. 저게 무슨 뜻이냐 하면, 똑같은 조사를 100번을 했을 때 그 중 95번 정도는 A후보에 대한 지지율이 42%에서 48% 사이에 있을 것이라는 뜻이다.

    언론에서 여론조사나, 다른 통계 수치를 갖고서 이야기할 때 봐야 하는 말은 위의 예시 문장에 다 들어가 있다. 표본수,
    평균값, 신뢰수준, 신뢰구간이 모두 나와 있어야 한다. 위의 문장의 경우 표본수는 1000명, 신뢰수준은 95%, 평균값은
    45%, 신뢰구간은 위아래로 3%포인트가 된다. 만약 하나라도 빠져있다면 아무리 저명한 연구기관이나 조사기관에서 발표했어도 그 통계는 믿을 수 없으며, 갖다 버려도 된다.


    신뢰수준을 높이면 신뢰구간은 넓어진다.

    신뢰수준을 높이면, 그 신뢰수준에 해당하는 신뢰구간은 평균이 그 안에 확실하게 들어가야 하므로 더 넓어질 수밖에 없다. 결국 신뢰구간을 줄이려면 표본의 수를 더 크게 키우는 수밖에 없다. 조사를 많이 할 수록 더 정확한 통계가 나오게 된다는 뜻이다.

    어떤 통계를 믿으려면, 표본이 충분히 커야 하고, 신뢰수준이 충분히 높아야 하며, 신뢰구간은 충분히 작아야 한다. 여기서, “충분히”라는 말이 과학적으로 들리지 않겠지만, 어쩔 수 없다. 이것은 각자의 소신과 경험에 맞춰서 믿을지 믿지 않을지를 정해야 한다.

    통계에 대해 좀 더 쉽고 재미있게 공부하고 싶다면 다음의 책을 추천한다.

    통계의 미학(

    http://www.kyobobook.co.kr/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=9788988165911&orderClick=LAH

    )

    이 책은 통계에 관심있는 일반인에게는 매우 추천할만한 책이다. 통계의 중요한 내용들을 쉽고 재미있는 사례를 통하여 소개하고 설명하고 있다.

    통계학 길잡이(

    http://books.google.co.kr/books?id=gUB2MwAACAAJ&hl=ko&source=gbs_similarbooks

    )

    통계학을 만화로 배울 수 있는 좋은 책이다. 은근히 전문적이지만 쉽고 재미있게 설명하고 있다.