[카테고리:] 언어

  • xkcd.com 가보기

    내가 자주 가는 웹 사이트 중에 xkcd.com 이라는 곳이 있다.

    주인장 소개를 읽어 보자.

    http://xkcd.com/about/

    Who are you?

    I’m just this guy, you know? I’m a CNU graduate with a degree in
    physics. Before starting xkcd, I worked on robots at NASA’s Langley
    Research Center in Virginia. As of June 2007 I live in Massachusetts.
    In my spare time I climb things, open strange doors, and go to goth
    clubs dressed as a frat guy so I can stand around and look terribly
    uncomfortable. At frat parties I do the same thing, but the other way
    around.

    난 말이지, 아나? CNU에서 물리학을 전공했어. xkcd를 시작하기 전엔, NASA에서 로봇을 연구했지. 2007년 6월에 메사추세츠로 왔어. 남는시간엔 등산을 하고, 딴집에 놀러가고, 이상한 옷을 입고 클럽에 가지.

    물리학 전공인게 맘에 든다. ㅋㅋ

    여기 첫 페이지에는 경고문이 하나 붙어 있다.

    Warning: this comic occasionally contains strong language (which may be
    unsuitable for children), unusual humor (which may be unsuitable for
    adults), and advanced mathematics (which may be unsuitable for
    liberal-arts majors).

    경고 : 이 만화들은 종종 강한 언어(아이들에게 안맞을 수도 있음), 이상한 유머(어른들에게 안맞을 수도 있음), 그리고 고등 수학(인문계 전공자들에게 안맞을수도 있음)를 포함하고 있다.

    멋진 경고문이다. 언젠가 나도 내 연구실에 저런 경고문을 붙여두리라.

    그리고 사실 그 밑에 보면 멋진 말이 아주아주 작게 적혀 있다.

    We did not invent the algorithm. The algorithm consistently finds Jesus. The algorithm killed Jeeves. The algorithm is banned in China. The algorithm is from Jersey. The algorithm constantly finds Jesus.


    This is not the algorithm. This is close.

    우린 알고리즘을 발명하지 않았다. 알고리즘은 충실하게 예수를 찾는다. 알고리즘은 Jeeves를 죽였다. 알고리즘은 중국에서는 ?겨났다. 알고리즘은 Jersey에서 왔다. 알고리즘은 계속해서 예수를 찾는다. 이것은 알고리즘이 아니다. 이것은 가깝다.

    뭔소린지 이해하겠는가?

    나도 모르겠다.

    이 사람은 자신의 만화를 응용한 상품을 팔고 있다.

    http://store.xkcd.com/




    Signed Prints

    These
    are high-quality prints of a number of strips, made from the original
    high-resolution scans (not the smaller web versions). Sizes vary to
    suit each comic and are all hand-signed.

    여기 있는 것들은 고해상도 스캔을 떠서 만든 진짜 좋은 인쇄 품질을 갖고 있다.(조잡한 웹버전 아님) 각각의 만화에 맞춰서 크기를 조절했고, 모두 손으로 그린 것이다.

    그 밑에는 가격에 대한 안내도 있다.

    Note on price: we get a lot of emails asking about donations. We
    like to send people something tangible for their money, so we’re
    offering these prints Radiohead-style — you can choose what to pay for
    them (above the default $15). If you want to donate money to the site
    but don’t want a bunch of merch, just order a print or two and set your
    own price. Thanks!

    가격에 대한 안내 : 우린 이메일로 기부금에 대한 문의를 많이 받는다. 우린 돈을 낸 사람들이 뭔가 만질 수 있는걸 주고 싶은데, 그래서 우린 라디오헤드 처럼 이 인쇄물들을 제공하고 있다. 최소한 15달러 이상의 돈을 내고싶은 만큼 선택할 수 있다. 만약 돈을 내고는 싶지만 많은걸 바라지는 않는다면, 한두장의 티셔츠 정도만 주문하면 된다. 감사.

    http://store.xkcd.com/#RegexCheatSkirt

    흥미로운건, 당신이 여자 개발자라면 참고할 수 있는 컨닝용 치마를 판다는 점.

    음…

    작아서 잘 안보인다면…

    아무튼. -_-; 관심있는 분은 하나 질러도 좋을 듯. 여자친구에게 선물용으로도 괜찮지 않을까…(물론 그 여자친구가 geek이거나 geek-like이어야겠지만.)

  • 아인슈타인과 보어

    아인슈타인이 이렇게 말했다.

    God does not play dice.

    보어가 이렇게 답했다.

    Einstein, don’t tell God what to do.

  • 그저 그래

    영어에 보면 “so-so”라는 관용 어구가 있다. 우리말로 직역하면 (의역해도 되지만…) “그저 그래”라는 뜻이다.

    당연하겠지만, 이 말의 어원은 so so 가 될 것이다.

    문득 떠오른 궁금증은, 두개 있는 so가 과연 같은 뜻일까 하는 점이다.

    내 생각에는, 앞에 있는 so는 뒤에 있는 so를 수식하는 것 같다. so는 단독적으로 쓰이면 부사로 “그렇게”라는 뜻이다. 수많은 생략과 축약을 뒤로한 채, 앞에 있는 so는 “그렇게”라고 해석하고, 뒤에 있는 so는 “그렇다”는 뜻으로 해석하고 싶어졌다.

    그렇게 그렇다. -> 그저 그렇다.

    이상한가?

  • Tremulous : The Visit


    http://www.tremulous.net/

    Haos Redro Corporation

    Titan Moon

    4025

    Haos 레드로 회사.

    타이탄 위성

    4025

    Ked
    stood quietly in the reception area, arms crossed over his black
    document case. He stared down the corridor to his left looking deep
    into the reflections on the black obsidian floor. Decadent. The stone
    was imported from Hedron – transport costs alone were above 10 million
    credits. Lives were most definately lost mining in the turbulent
    conditions of the 12 year new planet. Your life for this floor. We can
    walk on you…

    케드는 접견소에서 검정색 서류 가방 위에 양 팔을 걸치고 조용히 서 있었다. 그는 검정색으로 반사되는 바닥을 깊이 응시하고 있었다. 퇴폐적이다. 그 돌은 헤드론에서 수입된 것이다. 한개 수입 비용만 1천만 크레딧을 넘는다. 새로운 별의 12년간 그 엉망 진창인 환경에서 채광을 하면서 많은 인명을 잃었다. 이 바닥을 위한 당신의 생명인 것이다. 우린 당신 위를 걸을 수 있다.

    All elements and construction in this building were designed with a
    sense of authority – an over bodding dominance of man. The towering
    crystalline entrance pillars reduce anyone of stature into a meer
    blemish of shadow on the black floors. That was intentional. If you’re
    diminished in presentation you stand no chance of gaining leverage with
    one of the most powerful corporations in the known universe.

    이 건물에 있는 모든 재료와 건축은 권위적인 감각으로 설계되었다. 인류의 지배를 나타내기 위해. 결정체를 쌓아 만든 입구의 기둥은 아무리 키가 큰 사람이라도 그저 바닥의 먼지 정도로 밖에 안 보일 정도이다. 고의적인 것이다. 만약 당신의 존재가 사라진다면, 당신은 알려진 우주에서 가장 강력한 회사중의 하나의 영향력을 얻을 기회를 얻지 못한다.

    The small green sign above office doors flashed on. ENTER. The slide
    doors swooshed open revealing a brightly lit short corridor. Ked
    cleared his throat nervously. He felt a quick flush of perspiration on
    his palms. The sign pulsed again. Ked’s lip twitched as he stepped
    beyond the threshold with an uneasy weight, his legs feeling heavy.

    사무실 위의 조그만 녹색 표시가 깜빡거렸다. 들어옴. 미닫이 문이 휙 하니 열리면서 밝게 빛나는 짧은 복도가 드러났다. 케드는 그의 목을 신경써서 가다듬었다. 손바닥에서 땀이 빠르게 흘러내리는 걸 느꼈다. 표시가 다시 깜빡 거렸다. 케드의 입술이 경련을 일으켰다. 그는 다리가 무겁다고 느낄 정도로 힘겹게 문턱을 넘어섰다.

    Breathe.

    한숨.

    Once inside the lighted corridor, the open end closed shut on Ked. The
    hum of the lights came into the foreground then broken by the far end
    door sliding open. Ked approached the end and peered into the cavernous
    office space. The office was a large semi-circled room with exterior
    windows made from transparent fiber steel. The soft blue light off
    Titan’s surface covered half the floor in shadow. Freightliners could
    be seen carbing their engines just beyond the assemblage docks. Their
    massive forms moving dangerously close to the riggings. Ked stepped out
    of the corridor realizing that he had been frozen for a moment too
    long. His gaze moved around the room again finding the centerpiece of
    the office. A large slab of borewood replete with red moldings of
    synthium. Another symbol of decadence. Behind the desk sat a motionless
    figure, face cast in light from the display inlayed in the desk. Ked
    walked forward, stuffing his apprehension deep inside, suppressing his
    need to get out of there.

    일단 한번 밝은 복도 안에 들어서자, 케드쪽의 문이 닫혔다. 빛이 그의 앞에 도달하자 저 멀리 있는 문이 열렸다. 케드는 끝까지 도착해서 동굴같은 사무실 안을 자세히 살펴보았다. 사무실은 커다란 반원 모양의 방인데, 투명한 섬유 강철로 된 외부 창문이 있다. 타이탄의 부드럽고 파란 빛이 바닥에 반쯤 그림자를 드리운다. 컨테이너 화물열차가 조립 도크를 넘어서 보인다. 케드는 그 복도의 바깥으로 나가면서 너무 오랫동안 얼어 있었다는 사실을 깨달았다. 그의 시선은 방 주변에서 움직이며 사무실의 중심을 다시 차잤다. 커다란 나무 판이 신티움의 붉은 몰딩을 완전히 감싸고 있다. 또다른 퇴폐성의 표식이다. 책상 너머에 움직임이 없는 인간이 책상에 얼굴이 비쳐지도록 앉아있다. 케드가 앞으로 갔다. 깊이 주의하며, 그가 그곳에서 얻으려는 것을 숨죽인채.

    Run.

    달린다.

    “Ked Ambrit” The voice was old and stern. Ked diverted his eyes away
    from the man in nervous distraction. A scoutliner arced across the
    horizon past the panel on the left. Caught in a timeless stare Ked
    whipped his gaze back towards the man. His heart was pounding.

    “케드 앰브릿” 그 목소리는 늙고 엄격하다. 그는 그의 눈을 신경이 분산되면서 그 남자로부터 다른 곳으로 돌렸다. 스카우트가 왼쪽의 패널을 수평으로 지나가는 호를 그렸다. 그 무한정한 응시에 붙잡히면서, 케드는 그의 그의 시선을 그 남자로 되돌렸다. 그의 심장이 뛰고 있었다.

    Speak.

    말한다

    “Yes sir.” His voice was dry. He forced himself to salivate but still
    felt dry and acrid in his throat. The man behind the desk outstretched
    a dark slender hand, pushing a tight folder of sheets across the desk.
    The folder came into light before Ked.

    “넵” 그의 목소리는 건조했다. 그는 그 자신을 강제로 침이 나오도록 했지만, 여전히 건조했고 그는 목이 말랐다. 책상 너머의 남자는 그의 검고 길쭉한 손을 내밀어서 책상 너머로 여러 장의 빡빡한 서류철을 넘겼다. 그 서류철이 케드 앞의 불빛 안으로 들어왔다.


    “As you know Haos Redro has been recently expanding properties into the
    Brindus system.” His voice was affected, a result of being surrounded
    by abundant wealth his whole life.

    알다시피, 하오스 레드로는 최근 브린두스 항성계로 그 상품을 확장해 왔어” 그의 목소리는 영향력이 있었다. 그의 전 생애의 넘치는 부로 둘러싸여 있었던 결과다.

    “I am aware.” Ked spoke quickly to avoid cutting off a sentence.

    “These ‘properties’ , if developed, have the ability to make Haos Redro
    one of the most powerful entities in the universe.” He paused.

    Ked interjected, “Excellent sir.”

    “Indeed it is excellent Ked, if it were not for some
    recent…concerns.” The last word he spoke had an intentional
    inflection of importance. It wasn’t a small problem, this was a concern.

    “You’ve most likely read the shipping reports from last quarter.” “Yes” Ked answered sternly.

    “We lost 12 heavy cargo liners outside the Fractal Zion system.”

    “How did we lose them sir? I only remember seeing them listed in the
    loss report but not actually noted.” Ked had done his homework.

    “Ked, we encountered a lifeform not of our homeworld nor of any other
    homeworld. This ‘lifeform’ spreads like a virus. It killed the crew of
    all 12 ships. A few of our mining outposts are reporting alien activity
    was well.”

    “알고 있어요” 케드는 문장을 끊는 것을 피하려고 빠르게 말했다.

    “이 상품들은, 개발된다면, 하오스 레드로를 우주에서 가장 강력한 존재로 만들 능력을 갖고 있지” 그가 멈추었다.

    케드가 추임새를 넣는다. “멋지군요”

    “사실 멋지지. 케드, 만약 그것이 최근의 몇가지 걱정스러운 것들만 아니었다면…” 그가 말한 마지막 말은 중요한 억양이었다. 그건 작은 문제가 아니라, 걱정거리다.

    “자네는 지난 4분기에 선적 보고서를 읽었을 거야” “네” 케드가 단호히 대답했다.

    “우린 프랙탈 지온 항성계 바깥에서 12개의 대형 운반선을 잃었다”

    “우리가 그것들을 어떻게 잃어버린 건가요? 저는 오직 그 잃어버렸다는 보고에 있는 물건들 목록만 보았고 실제로 알지는 못하는 것으로 기억합니다” 케드는 그의 숙제를 해결했다.

    “케드, 우리는 우리의 고향이나 그 누구의 고향에도 없는 생명체를 만났어. 이 생명체는 바이러스같이 퍼지지. 그것은 12척의 배 모두의 선원을 살해하였지. 우리의 채광 기지들 중의 몇몇은 외계 생명체의 활동이 있다고 보고하고 있어”

    Ked stood stunned. Humans had certainly come into alien contact before
    but it had only been through micro organisms and plant life. This was
    new and extraordinary.

    케드는 충격받은채 멍하니 서 있었다. 인간은 이전에 외계 생명체를 만난 적이 있었지만, 그건 아주 작은 기관이거나 식물들이었다. 이것은 새롭고 예외적이다.

    “We don’t know their origins, we don’t even know the extent of their
    strength or weaknesses. We do know we have to eliminate this threat to
    the corporation. I’m putting you in control of this situation Ked. You
    will have to allocate resources for a militia patrol. The folder before
    you contains contacts for employing mercenaries and equipment.”

    “Right away sir.” Ked spoke with authority. The feeling of dread was gone from his body now. Ked would keep his job.

    “One more thing Ked.” The oldman was sly.

    “You will be on the next ship to the Fractal Zion as soon as you’ve assembled forces.”

    우린 그들이 어디서 오는지 알 수 없어. 우린 심지어 그들의 강점이나 약점을 알지도 못해. 우린 우리가 이러한 회사에 대한 위협을 제거해야만 한다는 것을 알지. 난 자네가 이 상황을 통제하도록 하겠어. 자네는 사병을 보낼 수 있을 거야. 자네 앞에 있는 이 서류철은 만나봐야 할 고용 중개인들과 장비 목록을 담고 있지”

    “알겠습니다” 케드는 신념을 담아서 말했다. 두려움에 대한 느낌은 그의 몸에서 이제 더이상 사라지고 없다. 케드는 그의 일을 할 것이다.

    “한가지 더, 케드” 그 노인은 음흉했다.

    “자네는 병사들을 조직하는 즉시 프랙탈 지온으로 가는 바로 다음 배를 타야 할 것이야”

    The feeling of dread was back.

    두려움이 다시 되돌아왔다.

  • 번역 알고리즘에 관하여

    요새 GRE랑 TOEFL 때문에 문법 공부를 좀 하다 보니, 그리고 GEB를 읽다 보니 영어를 한국어로 자동 번역하는 알고리즘에 대해서 생각하게 되었다. 영어와 한국어의 가장 큰 차이는 어순 차이이고, 따라서 단어를 일괄적으로 치환한 후에 어순에 맞도록 붙여주기만 하면 일차적으로 괜찮은 수준의 초벌 번역이 되지 않을까 생각해 보았다. 그래서, 아무생각없이 알고리즘을 한번 구성해 보려고 했는데, 생각해보니 이게 좀 복잡하다.

    1. 문장을 단어 수준으로 나눈다.

    2. 각 단어의 품사를 판정한다.

    3. 단어 중에서 전치사와 접속사를 찾는다.

    4. 전치사에서 파생된 전치사구에 해당하는 단어를 찾아서 전치사구로 묶어준다.

    5. 접속사에서 파생된 종속절에 해당하는 단어를 찾아서 절로 묶어준다.

    6. 전치사구를 해석한다.

    7. 종속절을 해석한다.

    8. 주절을 해석한다.

    여기에 부가적으로 동사구를 해석해서 시제, 태, 단/복수, 자/타동사를 처리하는 해석기가 필요하다.

    일단 가장 난이도가 있는 부분은 각 단어의 품사를 판정하는 부분이다. 가령, 문장을 단어들의 나열인 [a,b,c,d,..]로 이루어진 벡터라고 보자. 그럼 a는 명사, 형용사, 동사, 부사… 등등의 품사 중에서 하나일 것이다. b, c… 등등의 단어도 각각의 품사를 갖고 있을 것이다. 문제는 하나의 단어가 여러개의 품사를 가지는 경우이다. 가령 an는 관사로만 쓰이기 때문에 품사가 형용사밖에 없다. 그러나 characteristic은 명사로도 쓰이고 형용사로도 쓰인다. 그래서 품사가 뭔지를 알아내는 것은 꽤 어려운 작업이다. 그래서 생각해본 것이, 그 단어가 무엇을 수식하는지 알아내면 낫지 않을까 싶었다. 가령, 타동사는 반드시 목적어가 있어야 하고, 형용사는 반드시 그것이 서술하는 대상이 필요하다. 부사는 반드시 형용사, 동사, 다른 부사, 문장 전체중의 하나를 수식해야만 한다. 전치사는 반드시 그 목적어로 명사가 필요하다. 따라서 문장 내에 있는 특정 단어는 반드시 그 다음에 해석할 단어를 지정할 수 있다. (반드시 라고 말하면 어폐가 있겠지만…)

    그래서 이것을 하기 위해, 한 단어의 품사를 일단 가정한 후, 그 단어가 수식해야 할 대상을 지정할 수 있으면 넘어가고, 지정할 수 없다면 그 가정이 틀렸다고 판단하는 것이다. 이 과정을 재귀적으로 반복하다보면 더이상 품사 변환을 할 수 없는 고정점 벡터가 하나 나올 것이다. 그럼 이제 품사도 판정했고, 단어의 해석 순서도 결정 되었다. 이제 그 다음 3단계부터 쭉 따라가면 된다.

    이게 실제로 작동할 수 있는 알고리즘인지는 잘 모르겠지만, 언젠가 실제로 구현을 해보고 싶은 생각이 들었다.

    그런데 결정적인 문제가 있다.

    모든 단어에 대해서 각각의 단어가 가질 수 있는 품사에 대한 정보를 수록한 사전과, 각각의 단어가 각각의 품사일 때 어떤 뜻을 갖는지에 대한 정보를 수록한 사전이 필요하다. 이 사전을 구축하는 것도 실제로 일이 될 것 같다.

  • suicide는 자동사

    suicide는 자동사다.

    그런데, 과연 suicide는 타동사가 될 수 있을까?

    된다.

    근데 용법을 보면 suicide oneself 로 쓰도록 되어 있다. 즉, 재귀대명사만을 목적어로 가지도록 되어 있는 것이다.

    음…

    재귀적 용법으로밖에 사용하지 못하는 타동사가 무슨 의미가 있을지 모르겠지만.

    아무튼, suicide는 자동사다. 그 본래의 의미에서 단 한발짝도 벗어날 수 없다.

  • GRE 점수가…

    오늘 드디어 GRE점수가 나왔다.

    공부를 거의 못한…

    GRE General의 Verbal은 310/800. 9% Below다. 즉, 100명중에 91등 -_-;

    (영문법, 영단어, 영어 독해력 시험)

    공부를 전혀 안한…

    Quantitative는 790/800. 92% Below다. 즉, 100명중에 8등. -_-;

    (수리능력 시험)

    학원을 주말반으로 1달 다녀본…

    Analytical Writing은 3.0/6.0. 8%Below. 대충 쓴것 같다는 뜻이다.

    (분석적 글쓰기)

    아…

    어렵구나.

    공부를 아주 조금 했던…

    GRE Subject 시험 점수를 다시 찾아보니 870/1000 87% Below다.

    난 수학과 물리를 잘하고 영어를 지지리 못하는가보다.

    어떻게 공부하지…-_-;;;

  • 한국어 vs 영어

    최근 다시 영어 수업을 듣고 있다가 예전부터 하던 생각을 정리하게 되었다.

    한국어는 객체지향적이고 영어는 절차지향적이다.

    이건 내가 최근 java를 살짝 공부하면서 든 생각이다.

    한국어는 어떤 단어가 문장과 문맥 안에서 의미를 갖는 방식이 어조사를 통한 방법이다. 즉, 같은 단어라도 뒤에 어조사를 어떤 것을 붙이느냐에 따라 그 뜻이 달라진다.

    또한, 하나의 단어가 품사를 바꿀 때 단어 자체가 바뀌는 것이 아니라 어조사가 바뀌게 된다.

    즉, 단어가 원래 갖고 있던 의미(class)로부터 명사, 또는 형용사라는 형태(method)를 끌어내는 것이다.

    영어는 어떤 단어가 의미를 갖는 방식이 위치에 따라 달라진다. 같은 단어라도 동사 앞에서는 주어이고 동사 뒤에서는 목적어이다. 그리고 관계대명사를 통해서 다른 문장을 불러올 수 있다.

    정리하자면, 한국어는 java를 닮았고 영어는 C를 닮았다.