정보이론2021. 3. 28. 09:25

 정보이론 서적에서 언급되는 분야중에 흥미로운 것은 DNA 분야이다. DNA는 정보로 가득차있기 때문이다. 인간의 경우만 놓고 보아도 30억쌍의 ATGC... 배열로 된 유전자 정보를 1개의 세포가 온전히 매우 안정되게 포함하는 셈이고, 1개의 수정란에서 인간의 모든 것이 시작되어 생명을 형성한다.

 

 흥미롭게도 이 관점에서 왜 불로장생이 어려운지에 대해서 다양한 학설이 나왔는데, 아래가 간단히 정리해놓은 글이다.

 

scienceon.hani.co.kr/548962

 

세포 수준에서 일어나는 노화 현상, 그 원인들

[3] 세포 노화의 여러 원인들 인간을 대상으로 ...

scienceon.hani.co.kr

 

 핵심 논리는 이 DNA의 복제와 오류에 있다. 한 개의 수정란에서 시작된 인간의 세포체계는 지속 세포를 복제하여 신체를 만들어가는데 그 오류율이 상당히 낮고 잘못 복제된 DNA를 보정하는 기능까지 보유하고 있다. 그러나 오류율이 낮아도 없는 것은 아니다. 세포가 지속적으로 복제되고 교체되면서 작은 오류라도 점점 더 커지게 마련이다. 모든 세포에 대해 단일의 절대적인 기준을 두고 대사하면서 모든게 처리되지 않는다. 계속 복제되어 가면서 기존의 것과 최대한 같게 하려고 하지만 한번 오류가 발생하면 다시 복제될때는 그 오류가 전파된다. 따라서 생명체 입장에서 이 일관성 유지 문제는 난감한 일이다. 모든 세포가 하나의 원본을 수시로 참조할 수 없다. 그렇다고 DNA서열 전체를 hashing해서 비교해보고 버리지도 못한다.

 

 복제 과정에서 무엇이 정상적인 원본인지 알 수 없으며, 정보가 너무 크기 때문에(30억쌍) 비교하기도 어려운 것이다. 맨 처음 수정란에서 시작된 DNA정보는 오류의 축적을 피할 수가 없는 것이고, 이 부분에서 생명체는 공학적인 완성을 이루지는 못했다.

 

 이 전체적인 DNA의 정보전달 방식이나 변형 가능성은 노화와 암, 진화 모두에 영향을 끼치게 된다. DNA가 더 복잡할수록 더 많은 단계를 거칠수록 오류율이 높아진다. 오류율이 높아지면 오작동이 커지는데, 그 결과 새로 복제된 세포들은 필연적으로 불완전해진다. 더군다나 원본에서 더 멀어질수록(나이가 먹을수록) 더 불완전해진다.

 

 가끔씩은 생명을 진화시키는 돌연변이도, 이 불완전의 메카니즘을 바꾸지는 못했다. 아마도 유전자 시퀀싱 기술을 통해서 노화가 일어나는 단계별로 몸 전체 세포의 DNA 정보 불일치를 추적해나갈 수 있다면 더 자세히 이 과정의 진화를 알 수 있게 될 수 있겠다.

 

 그리고 태아 상태에서의 DNA 정보 변형은 치명적일 수 있다. 그 영향이 이후 복제된 수많은 세포들에 처음부터 영향을 끼치기 때문이다. 여하튼 또한 이러한 변형은 어떤 면에서는 돌연변이가 변화에 적응하여 진화하는 그 과정에도 기여하게 된다. 

 

 정보이론 관점에서 이러한 DNA문제를 파헤치면 여러가지 뜻깊은 사실들을 더 알 수 있지 않을까? 노화나 오류의 진전, 진화 이런 것들이 모두 영향을 받을 수 있다. 사실 그런 의미에서 간단히 이 이론들을 소개해 본 것이다.

 

 좀더 덧붙여보면 향후에 이 DNA 일관성을 외부 공학적인 방법을 사용해 유지할 수 있는가도 흥미로운 미래 이슈가 아닐 수 없다. 최근에 DNA변형된 세포를 찾아내 파괴하도록 하는 암 치료법이 소개되었는데, 이 방법은 변형된 DNA를 하나하나 검출해서 코딩해줘야만 파괴할 수 있다. 불행히도 아직 기술은 어떤 기준 원본 DNA를 만들어서 그것과 변형된 것을 찾아내어 파괴하지는 못한다.

 

www.monews.co.kr/news/articleView.html?idxno=301452

 

'세번째 CAR-T 등장' 4세대 면역세포 치료제 시대 도래 - 메디칼업저버

[메디칼업저버 양영구 기자] 세 번째 키메라항원수용체(CAR) T세포 치료제가 등장하면서 4세대 면역세포 치료제 시대가 앞당겨질 것이란 기대가 나온다.CAR-T 세포 치료제가 CD19 항원을 타깃해 다

www.monews.co.kr

이런 상황인데 만약에 DNA 변형이 전혀 불가능해지도록 하는(변형되면 무조건 파괴하는) 생명공학이 발견되면 어떨까?

그야말로 이론적으로는 불로불사의 시대가 열리게 되겠다(물론 다른 것도 해결되어야 할 수 있겠지만, 여하튼 기초가 되겠다. 오작동이 없어진다). 어느 정도의 기술발전이 되면 미래의 꿈의 기술 후보가 될 수 있지 않을까.

반응형
Posted by 작동미학
순수수학2021. 3. 8. 00:27

짐 홀트의 책 "아인슈타인이 괴델과 함께 걸을때'를 보면 무한을 최초로 정확히 해명한 수학자로 알려진 칸토어가 한 업적이 나온다.

 

첫째는 어떤 두가지의 무한이 서로 본질적으로 같다는 것을 증명하는 방법(무한한 자연수와 유리수가 같다)과 그렇게 같지 않은 더 큰 계위의 무한이 존재하며, 늘 그 무한을 원소로하는 집합을 재창조함으로서 그것이 가능하다는 증명을 했다는 점이다.

 

흥미롭게도 이 관점은 엔지니어로서는 무한이라는 것을 컴퓨터로 구현한다는 관점에서 바라볼 수 있다.

 

사실상 무한이라는 것은 단순히 큰 메모리를 할당하는 것으로는 구현할 수 없다. 이를 테면, 전체를 나타내기 위해서는 메모리가 부족하게 된다. 그래서 흔히들 컴퓨터에서의 변수의 크기는 가질 수 있는 값의 범위를 제한하여 격리한다. 그런데 사실, 잘 설계하면 셀수 없이 늘어나는 것을 담을 수 있게 설계는 할 수 있다(물론 메모리가 충분히 커야하는 것은 어쩔 수 없다)

 

돌이켜보면 0과 1사이의 유리수 값이나, 전체 정수값이나 사실은 본질은 같은 것이다. 왜 그런가 하면 두 무한한 수 체계를 나타내기 위해 구현해야 하는 컴퓨터 코드가 크게 다르지 않기 때문이다.

 

즉 유리수와 정수는 생긴 모양은 다르지만 무언가 특정해야할 하나의 값이고, 같은 비용을 들여서 구현할 수 있다는 말이다. 생긴 것은 다르지만 1:1로 매핑이 가능한 본질적으로 같은 구현으로 해소가능하다.

 

예를 들면, 무한의 수를 나타내는 것은, 앞서의 고정된 메모리를 범위로 간단히 할당하는 것 외에, linked list같이 나타낼 수 있다. 

 

가장 간단하게는 2진수를 무한히 표기할 수 있도록 하는 방법을 생각해보자.

 

2개의 bit를 가지고 그 왼쪽 bit는 더 상위비트가 존재하는지, 오른쪽 bit는 그 자리수의 bit값 형태로 나타내고 필요에 따라 계속 2개의 bit씩 늘려가면 무한한 값을 encoding할 수 있다.

 

실제 예를 들면, 자리수가 정해진 1 0 1 (2)는  11 10 01 (encoded 2, 앞 bit가 다음 자리수의 존재여부) 같은 형태로 나타낼 수 있다는 말이다. 그러면 이 체계는 곧바로 정수와 유리수 모두를 나타냄에 있어서 사실 크게 다르지 않다. 칸토어가 제시한 1:1 대응 방법으로 이름만 붙이면 그만인것이다. 그 두개의 집합은 같은 무한의 체계이며 기계적인 구현이 같다.

 

칸토어의 업적은 따라서 무한의 수 체계를 기계적으로 나타내기 위한 구체적인 구현 동의성을 나타냈다라고 은유할 수 있다. 그렇게 인류는 무한을 기존의 여러가지 추상적인 관점에서, 더 구체화하여 이해했다고 생각한다.

 

반응형
Posted by 작동미학
머신러닝AI2021. 1. 7. 23:54

재미있는 기사를 읽게 되어 소개해본다.

 

www.aitimes.kr/news/articleView.html?idxno=18835

 

KAIST 백세범 교수 연구팀, 데이터 학습하지 않은 심층신경망에서 고등 인지 기능 자발적 발생 원

KAIST(총장 신성철)는 바이오및뇌공학과 백세범 교수 연구팀이 학습 과정을 전혀 거치지 않은 신경망에서 고등 시각 인지 기능이 자발적으로 발생할 수 있음을 증명했다.이번 연구 결과는 신경망

www.aitimes.kr

 

논문을 읽어볼 수는 없었지만, 결론을 내려보면 "심층신경망 시뮬레이션 연구를 통해 모든 연결 가중치가 무작위로 초기화된 신경망에서도 `계층 구조'와 무작위적 피드 포워드 연결만 형성된다면 특정 수량에 선택적으로 강한 반응을 보이는 신경망 유닛들이 자발적으로 생성"된다고 쓰고 있다.

 

조금더 설명해보면, 계층 구조와 피드 포워드 연결만 가지고 있는 신경망이라면 그 가중치를 임의로 주어도 무언가 이 녀석이 특정 판단을 하는 인식기가 되기 쉽다(?)는 이야기이다. 특별히 무언가를 학습시키지 않아도 그렇다는 말인데, 이 이야기는 신경망이라는 구조 자체가 우리가 흔히 이야기는 '지능'이라는 성격을 갖기 쉬운 구조라는 말로 바꾸어 이야기할 수 있다.

 

진화관점에서 바라보면, 원시적으로 외부에 대한 센서 역할을 하는 세포가 정보를 특정 세포에 전달하여 반응을 조절했는데, 이 특정 세포군이 신경망 형태를 띄게 진화를 했다고 치자. 그러면 이 신경망 형태의 세포군들은 무언가 지능적인 판단이 가능했을 수 있다. 그러면 이제 간단하게 이런 신경망 형태의 중간 조직을 가진 생명체가 돌연변이로 나타나면 그 중에 일부는 좀 쓸만한 인식을 했겠다. 그러면 곧바로 살아남게 되고 이런 일이 가속되는 것이 가능하다는 이야기다.

 

바꾸어 말하면 우리 인간이 지능이라고 표현하는 것들은 사실은 이 신경망이라는 구조가 만들어내는 무언가 추상되게 일관된 인식기 같은 것일지도 모른다는 말로 또 다르게 말해볼 수 있다.

 

예컨데, 이런 신경망 구조를 별도 학습도 없이 임의의 가중치로 여러개 생성시켜서 사실 유전자 알고리즘 같은 것으로 계속 선택하여 바꾸면서 적합성만 평가해줘도, 어느 순간에서인가는 고등한 생명체가 탄생할 수도 있다는 가능성을 알려주는 연구라고 할 수 있지 않을까?

 

실험적으로도 수학적으로 후속으로 여러가지 시도해볼 것이 많은 재미있는 연구가 아닐까 싶다.

반응형
Posted by 작동미학
양자컴퓨터2020. 12. 10. 23:29

 양자 컴퓨터에 대해서 가장 좋은 질문 중의 하나가 바로 이 질문이라고 생각한다. 중첩도 알겠고, 관측할때 확정된다는 것도 알겠는데 어떻게 이런 것을 가지고 계산을 하는 것인가요?

 

 이 질문에 심각하게 답을 하려면 당연히도 몇가지 천재들의 도약을 자세히 이해해야 될텐데, 문득 평범하게는 이렇게 비유해볼 수 있겠다는 생각이 들었다.

 

 우리가 디아블로 같은 3D게임을 하기 위해서는 컴퓨터는 열심히 계산을 해야한다. 컴퓨터 안에는 온갖 사물들에 대한 3D 틀이나 표면 정보가 들어있고, 시야가 바뀌면 GPU를 동원해서 정확히 우리 눈에 비추게될 장면을 만들어내고 있는 것이다.

 

 자연도 사실은 똑같이 자연의 법칙에 따라 움직이도록 특정 계산을 수행하고 있다. 예를들면 양자 하나의 운명을 결정하기 위해서는 양자역학 법칙들을 계산해낼 필요가 있는 것이다. 그런데 이 양자들이 백개 정도 얽혀서 이루는 결과를 고전 컴퓨터로 계산하려면 얼마의 컴퓨팅이 필요할까? 정답은 어마어마하다. 양자가 더 많이 동시에 다뤄질수록 이 컴퓨팅 필요량은 기하급수적으로 늘어난다.

 

 자 이제 다시 디아블로 게임 이야기로 돌아가보자. 디아블로의 물체들의 실제 위치나 모양은 알고 있고, 조금 움직여서 발생하는 두 장면의 차이를 측정했다고 치자. 그러면 우리는 무엇을 알 수 있는가? 바로 그 차이를 구해낸 GPU의 계산 결과를 확보하게 된 셈이다. 즉 디아블로 게임을 위해 GPU가 한 계산의 결과를 알게 된 셈이다. 내가 한 것이라고는 측정 뿐인데, 내가 손에 들게 된 것은 GPU의 계산 결과이다. 즉 우리는 디아블로의 물체를 어느정도 움직였을때 한 계산의 결과를 알게 되었다. 모든 경우에 대한 결과값을 알아낼 수 있다면 더 범용 컴퓨터를 만들 수 있을텐데, 여하튼 이 특수 케이스의 계산에 대해서는 입력과 출력을 알게되었다. 그렇다. 컴퓨팅을 살짝 훔친 것과 같다.

 

 그러면 양자 100개를 동시에 다뤄서 어떤 결과를 측정했다고 치자. 그것은 우리가 앞서 소개한, 고전 컴퓨터로 엄청난 시간을 계산해야만 얻을 수 있는 결과를 한번에 알아낸 셈이 된다. 짜잔! 우리는 방금 자연이라는 컴퓨터의 초고성능 컴퓨터의 결과를 훔친 셈이다. 앞서 디아블로에서 GPU의 계산 결과를 훔친 것과 또 같다.

 

 그런데 한번 더 아이디어를 내서 이 계산 결과를 가지고 무언가 우리에게 유익한 계산을 할 수는 없을까? 분명히 전세계 컴퓨터를 다 합쳐도 수억년 걸리는 계산의 결과를 순식간에 거머쥐었는데, 이 결과를 가지고 무언가 해낼 수는 없을까? 그렇다 그것이 바로 피터 쇼어의 알고리즘이며 그루버 알고리즘인 것이다. 그리고 이 결과를 가지고 더 많은 범용적인 계산을 하고 싶어하는 연구가 바로 요즘의 양자 컴퓨터 계산 알고리즘 연구가 되겠다.(그러나 사실은 이 과정이 쉽지 않기 때문에 양자 컴퓨터로 범용의 계산을 하기가 어려운 것이다.)

 

 양자 컴퓨터 자체도 예전에 소개했듯이 리처드 파인만이 처음 제안한 것은 이 양자 시뮬레이션이었다. 도저히 컴퓨터로 계산을 할 수가 없으니까, 직접 양자를 가지고 돌려보자(?)에서 시작되었다고 볼 수 있다. 그런데 지금은 이 양자를 측정한 결과치를 특정한 단계를 거쳐서 간접적으로 어떤 계산을 빠르게 하는데 응용하고 있다고 볼 수 있다.

 

 대개 그 계산이라는게 역시 사실은 양자를 어찌어찌 배열해가면서 혹은 바꿔가면서 그 결과를 관측하는 것이다. 그런데 그렇게 하면 고전 컴퓨터로는 엄청난 시간이 걸리는 계산들을 계속 살짝살짝 훔치게 되고 그것들을 정교하게 복잡한 알고리즘을 거쳐 특정 계산을 수행해 내는 것이다.

 

 자 그러면 대체 이 관측 결과를 어떻게 응용해서 특정 계산을 한다는 말인가? 이제 피터 쇼어의 알고리즘 공부와 양자 컴퓨터 코딩을 할때가 된 것이다. 피터 쇼어는 위의 디아블로가 계산한 두 이미지의 차이를 가지고 특정 계산을 하는 방법을 알아낸 것과 같다. 기가 막히지 않은가. 이걸로 어떻게 무슨 계산을 한다는 건가! 그런데 된다는 것..

 

 

 이쯤해서 피터 쇼어의 육성을 한번 듣고 나머지는 다른 글에 맡기겠다(이 분이 원래 자기 일하면서 부업으로 틈틈히 피터 쇼어의 알고리즘을 만든건 잘 알려진 사실이다.)

www.youtube.com/watch?v=hOlOY7NyMfs

 

반응형
Posted by 작동미학

해당 글은 아래 링크로 이동하였습니다.

 

finai.tistory.com/2

 

폐쇄망에서의 redhat(RHEL) 혹은 CentOS rpm /yum 패키지 설치 방법

 Linux에서 과거 패키지 설치는 소스코드를 받아서 직접 gcc/g++로 컴파일하는 형태로 많이 설치하였다. 그러다가 rpm(redhat package manager)이 등장해서 조금더 편하게 설치하게 된 것이 yum이나 apt같은

finai.tistory.com

 

반응형
Posted by 작동미학
순수수학2020. 7. 29. 01:42

 랜덤에 대해서 가장 인상적이었던 것은 https://infoengineer.tistory.com/5 에서 언급했듯이 폰 노이만의 "임의의 숫자들을 낳는 산술적 방법을 고찰하는 사람은 누구나 할 것 없이 당연히 죄를 짓고 있는 것이다" 라는 말이다. 기계적으로는 사실은 완벽한 랜덤을 만들 수가 없다. 기계는 알고리즘에 의해 정해진대로 값을 출력하게 되는데, 랜덤을 만드려는 인간은 예측 불가능한 값을 원하는 것이 함정이다. 기계는 예측 가능할 수 밖에 없기 때문이다. 오로지 유사 난수(난수처럼 보이지만 사실은 엄밀한 의미에서는 예측이 가능한 난수)만 기계로 생성이 가능하다.

 

 이론적으로는 기계가 만드는 난수는 튜링머신이 만드는 난수이고, 같은 튜링머신으로 예측이 가능하다고 간단히 정의할 수 있다. 즉 기계가 만드는 난수는 예측불가능한 난수가 아니다. 단지 모를 뿐이다.

 

 

 그런데 자연에서의 여러 현상을 기술하는 것은 랜덤으로 다뤄지고 있다. 앞서 소개한 양자 난수 발생기도 그러한 원리에 기원한다. 그러나 나는 이론적으로는 이것이 더 엄밀하게 정의되고 매칭될 필요가 있다고 생각한다. 수많은 확률/통계가 순수한 예측불가능한 랜덤을 가정하는데 자연이 실제로 그렇게 작동할지는 아무도 모를 일이다. 그런데 랜덤을 계속 고민하다보면 랜덤에 그 레벨이나 등급이 있다는 사실을 금새 깨닫게 된다. 그리고 그 안에는 대칭의 속성들도 연관된다.

 

 먼저, 시작하기 전에 모든 무한한 랜덤은 기술적으로는 무한히 발생하는 0과 1의 흐름으로 대치될 수 있다는 것을 밝혀두자. 단순히 생성되는 숫자를 2진수로 바꾸는 것만으로도 이 논리는 성립한다. 그런 숫자를 무한히 생성하면 결국 0과 1의 무한한 나열로 곧바로 매핑된다.

 

 추가로 코멘트 해둘것은 아래 각 등급은 지속 검토하여 더 세분화되거나 같은 것이면 합치는 과정을 반복하게 될것이라는 점이다. 여기서는 일단 시작을 해보자.

 

랜덤함에서 있어서 기본적으로 2가지를 기대한다.

 

1) 랜덤은 대칭적인 분포를 기대한다. 누구도 편중된 것을 랜덤하다고 하지 않는다. 무한히 발생하는 0과 1의 흐름은 결국 50%:50%씩 발생하는 것을 기대하게 한다. 이 공평함이 깨질수록 랜덤하지 않다고 간주된다. 0과 1의 상대적 비율이 랜덤하지 않음을 나타내게 된다.

 

2) 랜덤은 예측 불가능을 기대한다. 누구도 예측가능한 것을 랜덤하다고 하지 않는다. 위에 언급한 것처럼 튜링머신이 만들어낼 수 있는 0과 1의 흐름은 랜덤함에서 어긋난다고 볼 수 있다. pi의 소수점 이하 자리수, 무리수의 소수점이하 자리수 전개가 대표적인 예인데 반복되지 않고 고르지만, 곧 그 숫자를 나타내는 전개를 찾아낼 수 있다. 즉 튜링 머신으로 그 소수의 전개를 따라 예측해나갈 수 있게 된다. 하지만 신기하게도 반복되지 않는 무리수는 그 소수점 이하 2진수 전개가 모두 반복되지 않으면서 대칭적인 분포를 기대할 수 있을 것이라 예측된다. 나는 이것이 수학적으로 증명할 수 있으리라 기대한다. 즉 2진수로 무한히 나타내어질때 0과 1의 빈도수가 50:50으로 수렴하며 0과 1의 일정 길이 패턴들도 마찬가지로 고르게 분포하며 순서가 없다는 점이다.

 

ㅇ예를 하나 들어보자. 01010101..로 무한히 반복되는 수는 1)의 대칭적인 분포를 기대할 수 있지만, 아무도 이것을 랜덤이라고 하지 않는다. 예측 가능해지기 때문인데, 동일 패턴이 반복되는 것은 곧바로 튜링 머신으로 대치할 수 있기 때문이다. 이는 랜덤이라는 요소의 예측 가능성에 몇가지 정도가 있음을 나타낸다. 그런데 사실 위에 언급된 것처럼 파이 이하의 소수점도 본질적으로는 010101같은 반복패턴과 같은 것은 역시 튜링머신으로 이를 구할 수 있기 때문이다. 아마도 차이는 무한히 예측하기 위해서는 알고리즘이 조금더 복잡해지는 정도겠다.

 

 따라서 이 튜링머신의 예측 복잡도를 정의하면 랜덤함을 조금더 수학적으로 정의해볼 수는 있겠다(다만 그런 행위가 의미를 가지는지는 아직 모르겠어서 생략한다)

 

----------------------------------------------------------------------------------------------------------------------------------

#TBD

 

그리고 다음 질문은 이 대칭적인 분포와 예측 불가성이라는 두 속성의 관계에 대해서이다. 언뜻보면 예측 불가능성이 대칭적인 분포를 강제하는건 아닐까 생각이 들 수 있다. 이건 생각보다 쉽지 않은데, 대칭적인 분포를 보증하기 위해서는 어찌보면 과거에 0만 계속 나왔다면 앞으로는 1을 더 많이 출력해야하는 경향을 더 지니게 되는 형태로 유도되기 때문이다. 즉 신기하게도 과거가 예외적인 상황일 수록 예측 가능해지게 되는게 아닌가?

반응형
Posted by 작동미학
정보이론2020. 7. 28. 01:10

여기서는 먼저 이 영상을 게시해보자. 최근에 맥스웰의 도깨비 연관하여 가장 잘 짧게 설명된 영상이라 생각한다.

https://www.youtube.com/watch?v=T6CxT4AESCQ

 

개인적으로는 정보 이론이 물리학의 법칙에 끼어든 가장 인상적인 사례 중의 하나이다. 그렇다. 맥스웰의 도깨비, 엔트로피, 정보에 대한 이야기는 매우 유명한 이야기가 되어버리긴 했다.

 

 이 이야기는 열역학 제 2법칙 즉 엔트로피 증가의 법칙이 맥스웰의 도깨비(Maxwell's Demon, 사실은 맥스웰의 악마다)에 의해 깨진다는 맥스웰의 지적(1867년 사고실험)에서 시작된다. 천재 맥스웰은 이런 것도 건드렸다.

 

 엔트로피 증가는 간단히 말해서 찬물과 뜨거운물 합쳤을때 그 둘이 자연스럽게 랜덤하게 섞이며 그 둘의 합쳐진 평균 온도로 변하는 현상이라고 말할 수 있다. 그런데 놀랍게도 이 둘을 다시 찬물과 뜨거운물로 분리하는 것이 가능하다. 어떻게 하는가?

 

 섞인 물의 한가운데 아주 작은 문을 놓고 아주 작은 존재가 보다가 찬 물 분자는 막고 뜨거운 물 분자만 통과시키면 어느 순간 한쪽은 뜨거운 물이 한쪽은 차가운 물만 생긴다. 이 문은 너무도 가벼워서 움직이는데 거의 힘도 들이지 않는 존재라고 해보면, 이렇게 셋팅하는 순간 열역학 제2법칙이 무너지는 모양새이다.

 

 그런데 맥스웰이 지적한 후 근 백년 동안 여기에 반박을 할 수 있는 사람이 없었다. 즉 이 구성이 열역학 제2법칙에 위배되지 않으려면 이 도깨비가 엔트로피를 늘린다는 것이 증빙되어야 한다는 점이다. 도깨비가 물 분자를 보고 문을 열고 닫는 행위는 일종의 정보처리이기 때문에, 이 이야기는 결국은 정보이론과 연결되게 된다.

 

 여러분은 어떻게 생각하는가?

 

 유투브 동영상을 계속 살펴보면 이 맥스웰의 도깨비를 튜링머신으로 설명하기도 한다. 그리고 이 튜링머신이 과연 엔트로피를 증가시키느냐 아니냐를 판단하게 된다. 과연 찬물과 뜨거운물은 과연 특별한 에너지도 없이 저절로 엔트로피가 감속했다는 말인가?

 

 여기에 나타난 구세주는 바로 IBM연구소의 Rolf Landauer다. (Landauer, R. (1961), "Irreversibility and heat generation in the computing process", IBM Journal of Research and Development 5 (3): 183-191)

 

 IBM의 연구원이었던 Rolf Landauer는 이론적으로 가장 적은 에너지로 구동되는 컴퓨터를 상상하고 연결하다가 결국 도저히 에너지를 절약할 수 없는 기능을 발견한것이다. 바로 데이터 삭제(erase)다.

 불행히도 세부적으로 정리하지는 못하지만, 결국에는 튜링머신을 최소한의 에너지로 구동하도록 아무리 설계해도 유한한 메모리를 가졌다면 메모리를 지우는데 에너지가 소모된다(란다우어 한계보다 큰 에너지)는 증명을 해놓은 것이다(무려 증명이다). 결국 맥스웰의 도깨비는 자연의 한계에 따라 유한한 메모리를 가질 것이고, 결국에는 그 한계에 다다르고, 에너지를 소모하게 된다(결국 엔트로피를 발생시킨다) 그래서 결국에는 열역학 제2법칙이 깨지지 않는다는 말이다.

 

 놀랍지 않은가. 이론적으로도 정보처리가 물리적인 엔트로피의 원리와 연결된다. 마치 질량이 에너지라는 것을 처음 수식으로 유도했던 아인슈타인의 그것처럼, 이런 식이라면 정보가 질량이다는 말이 나올 수 있는 것은 아닌가. 정보가 에너지로 변환되거나 이럴 수도 있겠다.

 

 그도 그럴 것이 블랙홀에 빨려들어간 물체의 정보가 사라지거나, 여러가지 후속 논의들이 진행되면서 정보이론은 현재 물리학에서 활발하게 활동하는 것 같다. 정보 보존의 법칙이 나올 기세다. 여하튼 앞서 추천했던 양자정보이론(한스 크리스천 폰 베이어)에서 양자역학이 정보이론에 의해 또다른 진보를 이룰 것으로 기대하고 있다.

 

 오늘은 여기서 간단하게 열역학 제2법칙과 란다우어의 정보이론이 맥스웰의 도깨비를 통해 어떻게 이어지는지 간단히 살펴보았다.

 

반응형
Posted by 작동미학
순수수학2020. 6. 20. 23:58

앞서는 1차원상에서 대칭을 통해서 정수를 전개할 수 있음을 알았는데, 그러면 다차원에서의 대칭은 무엇일까? 이에 대한 답을 찾아가는 과정에서 여전히 대칭의 핵심 개념은 "다르지만 같은" 존재이다. 즉 관점(축)을 바꿔도 이전과 같게 보이는 것이 대칭 관계 구성의 핵심이다.

 대칭을 위와 같이 "바뀐 관점"에서 기존과 동일한 것을 다룬다면, 대칭의 핵심은 또한 "바뀐 관점" 즉 변환에 있다는 사실을 알 수 있다.

 

 이전에 소개한 1차원상의 0점을 기준으로 거울로 바라보는 관계에 있는 곳의 위치가 바로 이런 대칭 관계를 구성하는데, 이렇게 동치를 만드는 축이 x축, -x축(x축을 뒤집어서 음양의 방향이 바뀐것) 2가지의 축 구성 방식이다.

 

아래 이 2가지 축을 살펴보자.

0을 기준으로 방향이 바뀌면 이 1, -1은 사실은 같은 점으로 볼 수 있다.

 

그런데 축, 즉 좌표계는 '관점'에 따라 다양한 대칭을 창조해 내도록 할 수 있다. 바로 앞 처럼 간격이 일정한 좌표계가 아니라 간격이 달라지는 좌표계라고 하면 조금더 다른 대칭을 만들 수 있다. 예를 들면 이런건 어떤가? 일반 적인 상황에서는 전혀 대칭이 아니라고 생각되지만 변환의 정의나 축의 모습을 다르게 하면 일련 대칭이라고도 볼 수 있다. 즉 대칭은 변환이 서로 같으면서 다른것이 될 가정만 만족하면 성립된다.

 

간격이 다른 이상한 좌표계에서의 대칭은 이럴 수도 있다.

 이렇게 기존의 우리가 알던 대칭이(반사 대칭, 미끄럼 대칭, 회전 대칭 등) 특정한 가정하에서 벌어지고 있음을 알게 되면, 대칭은 가정에 따라 정의되기 나름이라는 사실도 곧바로 알 수 있다. 대부분의 수학자들 사이에 논의되는 대칭은 평등하다고 생각되는 기준에 의거하는데, 대체로 1차원을 예로 들면 0을 기준으로 거울대칭이 그 대표적인 예(첫번째로 예를 들었던)가 되겠다.

 

 그러면 2차원 대칭에서의 대표적인 거울대칭과 회전대칭 등은 어떻게 규정할 수 있을가? 사실은 3차원에 익숙한 우리가 2차원을 바라볼때, 2차원에서 벗어나서는 뒤집고 뒤틀어서 다시 돌아가도 서로 등가라고 생각한 변환들에 의거한다. 조금더 구체적으로 말하자면 x,y,z축이 자유롭게 변환되지만 scale이 달라지는 상황을 가정하지는 않는다. 상식적인 수준에서의 대칭이 다뤄진다고 이야기할 수 있을까.

 

 더 자세히 기술해보면 거울대칭은 축의 음,양의 방향 전환을 의미한다. x축이면 -x축으로 뒤집힌 것이고, y축이면 -y축으로 뒤집힌 것이다. 음과 양의 방향이 앞서 서술한대로 "같으면서 다른", "뒤집힐 수 있는 임의적인" 것 이라는 점을 생각해보면 어렵지 않게 이 둘이 대칭관계가 본능적으로 인지됨을 알 수 있다.

 

 미끄러짐 대칭은 축의 전환이다. x축과 y축을 서로 바꾸면 된다. 

 

 회전대칭은 조금더 어려운데 x,y축이 상호간의 방향을 유지한체 말그대로 회전하고 있는 것이다. 0점을 기준으로 원을 그린다음에 축을 조금씩 돌려나가면서 생기는 대칭을 다룬다. 이렇게 3개의 기본 대칭을 다루는 것이 2차원의 대칭이다.

(그리고 조금 생각해보면 서로의 대칭들 간에 관계가 있음을 알 수 있다. 회전대칭을 이루는 축 변화의 특정한 형태(90도, 190도, 270도 등)가 바로 거울대칭과 미끄러짐 대칭의 특정 유형의 일부이다. 그러나 신기하게도 회전만으로는 거울/미끄러짐 전체를 구성할 수는 없다.

 

90도 축 회전의 연속시 축 변화

 

x,y의 방향변화 각 4개 * 축 교환 2개 = 8가지 경우 (빨간색은 회전변환으로 생성가능)

 여기서 단순하게 차원별로 몇개의 대칭관계를 지닌 축의 유형이 존재하나를 추적해보다. 단 여기서는 회전대칭은 논의에서 빼자. 회전 대칭은 사실은 수없이 많으므로(무한대) 다루기가 까다로워 져서, 거울대칭과 미끄러짐 대칭 즉 음/양 방향전환과 축 교환만을 염두해두자.

 

1차원에서는 2개의 축 구성 방식이 존재한다. x축 하나의 음과 양의 방향 2가지 축 구성 방식이 있다.

2차원에서는 8개의 축 구성 방식이 존재한다. x,y 2개 축의 음양이 각각 2개이며, 여기에 x,y의 축 교환 2개 조합이 있다.

3차원에서는 18개의 대칭쌍 유형이 존재한다. x,y,z 3개 축의 음양이 가각 2개이며, x,y,z의 축 교환 6개(=3!)이다.

 

그래서 n차원에서는 n*2*n! 축 구성 방식이 존재한다는 것을 알 수 있다.

 

차원 대칭쌍 유형 수식
1차원 1 1*2*1!
2차원 8 2*2*2!
3차원 36 3*2*3!
4차원 192 4*2*4!
5차원 1,200 5*2*5!
6차원 8,640 6*2*6!
7차원 70,560 7*2*7!
8차원 645,120 8*2*8!
9차원 6,531,840 9*2*9!
10차원 72,576,000 10*2*10!
11차원 878,169,600 11*2*11!
12차원 11,496,038,400 12*2*12!
13차원 161,902,540,800 13*2*13!
14차원 2,440,992,153,600 14*2*14!
15차원 39,230,231,040,000 15*2*15!
16차원 669,529,276,416,000 16*2*16!
.. .. ..
24차원 29,781,523,283,195,493,089,280,000 24*2*24!

 

24차원의 공간에서는 사실상 우리가 임의 좌표 축을 그리면 그에 대응되는 대칭 좌표축이 자연스럽게 저렇게나 많이 존재한다(물론 모든 축간의 교환이 동등한 경우에 말이다). 그리고 그 한 방식은 저렇게 수많은 방식과 사실은 같은 대칭 관계를 구성하게 해준다.

 

차원이 확대될때의 대칭의 의미에 대해서 제대로 숙고된 별도 자료를 찾을 수 없어 개인적인 메모를 일단 올린다. 향후 잘 정의된 일반화를 찾게 되기를 바란다.

반응형
Posted by 작동미학
정보이론2020. 6. 17. 23:44

코로나 바이러스 시대를 맞이하여(?) 정보엔지니어에서 바이러스와 생명의 일반화(?)에 도전해보려고 한다. 일반화라니?

 

 먼저 책 하나로 시작할텐데, 양자역학에서 다루었던 슈뢰딩거는 노년에 느닷없이 "생명이란 무엇인가?"로 강연을 하고 이 강연을 묶어 출판한 작은 책이 바로 동명의 작은 책이다(1944년 출간).

http://blog.naver.com/PostView.nhn?blogId=exbris&logNo=221332986820

 

생명이란 무엇인가 – 생명체는 물리 법칙을 따르는가?

생명이란 무엇인가.정신과 물질 작가 에르빈 슈뢰딩거 출판 궁리 발매 2007.07.05. 평점 리뷰보기 환갑의 ...

blog.naver.com

 그리고 이 책은 그가 한, DNA가 밝혀지지 않았던 그 시기에 유전정보와 생명에 대해서 지금에서야 당연하지만 그때 당시에는 선구자적인 그러한 예측들이 등장한다.

 

 맨 먼저 생명체는 상당히 크기가 커야한다고 주장한다. 원자 수준의 입자들은 양자역학적인 특성으로 늘 무질서한 운동을 하기 때문에 늘 엔트로피를 거슬러 살아가야하는, 질서를 전제로 하는 생명과는 맞지 않다는 설명이다. 즉, 충분히 커야만 일관성을 가지고 음의 엔트로피를 지니며 존재할 수 있다는 점이다. 정교하고 예측된 상호작용만이 에너지를 대사하며 무질서에 저항하고 자신을 보존하고 자손을 퍼트릴 수 있기 때문이다. 

 

 그리고 다음 주장이 더 중요한데, 유전 정보에 대한 것이다. 유전정보의 크기를 대략 1000개 정도의 원자 크기 정도로 보았다. 양자역학의 불연속성과 분자 수준의 구조만이 어떠한 정보를 보관하면서 일관되고 변형되지 않게 안정될 수 있다고 보았다. 유전자의 분자구조에 대해 아무것도 모를 당시로서는 명쾌하고 놀라운 예측이 아닐 수 없다. (프란시스 크릭 등이 모두 이 책에서 영감을 얻어 유전자 연구를 시작했다고 알려져있다)

 

 조금더 구체적으로 접근해보면 인간의 유전자 30억쌍을 변형없이 저장하고 계속 복제하는 방법을 엔지니어 관점에서 고민해보면, 그것이 쉽지 않다는 것을 단박에 알 수 있다. 거시적인 세계에서의 기록과 복제는 늘 당연하게도 변화하기 때문이다. 바위에 새긴 글씨도 곧 닳아 없어지고, 금속은 녹슨다. 톱니는 늘 오류를 일으키며, 아날로그로 대표되는 복사는 늘 오류를 양산한다. 생명체도 돌연변이가 있지 않느냐 반문할 수 있겠으나 기본적으로 그 돌연변이라는 것은 매우 드물며, 그것이 30억쌍이라는 정보를 대상으로 한다는 사실을 감안하면, 생명체는 어마어마하게 정확한 저장소이자 복제 수단을 갖지 않으면 안된다는 사실을 알아차릴 수 있다. 그것은 아날로그같은 것이 아니라 디지털의 무엇이어야만 한다. 뚝뚝 끊겨야 하고 엄청난 힘이 아니고서는 변하지 않는 것이어야 한다.

 

 자연이 그러한 요구사항을 만족시키면서 유전 정보를 다루는 자연스러운 방법은 슈뢰딩거의 주장대로 분자 구조에 저장하는 법 뿐이라고 생각된다. 그래서 필연적으로 그것은 거시적인 생명체가 관찰하기 어려운 아주 작은 것(분자수준)이며, 웬만해서는 부서지거나 변형되지 않는 안정적인 존재이며 필요하면 어떤 프레임웍하에서(DNA복제) 금방 복제될 수 있는 존재여야 한다.

 

 그러면 이러한 상황에서 바이러스는 무엇인가? 바이러스는 밝혀진대로 이러한 특성을 지니는 유전정보의 일종의 부스러기다. 이 유전 정보는 다른 생명체에 침입하여 유전 정보 복제기에 자신을 도달시킬만한 최소한의 수단만 갖추고 있는 작은 덩어리다. 일단 DNA를 다루는 표준 체계의 공장에 도달하기만 하면 곧 복제되고, 계속 다른 세포로 옮겨갈 수 있으며, 다시 또다른 생명체의 다른 세포에 도달하기만 하면 같은 과정을 반복한다. 생명체들이 사회와 생태계를 이루며 서로 닿지 않고는 살아갈 수 없다는 사실을 알면 이또한 필연히 일어나는 과정이겠다.

 

 

 이러한 존재는 적당한 구조와 조건만 생기면 끈질기게 살아남을 수 있다. 어떻게 완전히 박멸한다고 해도 돌연변이에 의해 또한번 생겨날 수 있다. DNA 부스러기들은 지금도 DNA 복제 과정에서 세상에 계속 창조될 수 있기 때문이다. 우연히 그 부스러기가 저런 특성을 갖기만 하면 된다. 그리고 그 부스러기는 다시 돌처럼 닳지도 금속처럼 녹슬지도 않게 보존되다가 우연히 생명체를 만나면 또 복제되어 같은 전파 과정을 거친다.

 

 컴퓨터 바이러스도 같은 맥락으로 볼 수 있다. 기본적으로 저장장치들은 변형되지 않도록 정보를 저장해야 하고, 바이러스는 그 안정성 속에서 자기 자신을 복제하는 코드를 뒤집어 쓰고 무언가 복제될때 같이 복제되거나 강제로 복제하여 전파시키는 트릭을 부린다(네트워크를 통해 나가거나 다른 저장매체에 복제되거나). 역시 변형없이 저장되어 있다가 그 코드를 실행하는 공통된 환경을 만나면 또다시 자신을 복제해 전파되어 나간다. 생명체와 바이러스의 관계처럼, PC에서는 바이러스가 자생으로 생길 확률은 거의 없다 치더라도(컴퓨터는 돌연변이를 훨씬 덜 발생시킨다) 외부에서의 이식(인간의 개입)이 이 바이러스 탄생을 대신 유발시킬 수 있으며, 물리적으로 보이지 않는 크기로 유지되고 저장되고 복제 된다는 점도 같다.

 

 이러한 일반화를 다시 설명해보자면, 우주 어딘가 외계에 지구의 DNA 기반 생명체와는 전혀 다른 체계의 생명체와 유전자 정보가 있다고 해도, 위의 지적들 때문에 생명체는 우리 눈에 보일 정도로 클테고, 그 유전자 정보는 우리 눈에 안보인다는 이야기이다. 그리고 아주 높은 확률로 그 생명체에도 바이러스라는 존재가 있을 테다. 그 녀석은 생명체의 복제 체계를 활용해 계속 증식하며 또 다른 생명체로 옮겨다닐 것이고, 박멸되었다가도 다시 돌연변이로 나타나서 또 그 생명체 안에서 맴돌지 않겠는가.

 

 서글픈 현실이지만 옛 물리학 거장의 예측을 가지고 일반화시켜 보면 위와 같다. 정보와 생명이라는 특성 그리고 물리적인 조건들이 이러한 상황을 만들어낼 수 있겠다.

 

반응형
Posted by 작동미학
클라우드기술2020. 6. 7. 22:51

해당 글은 아래 링크로 이동하였습니다.

 

finai.tistory.com/4

 

분석가들을 위한 클라우드 이야기 - 클라우드와 Kubernetes

 나는 머신러닝으로 역사를 이루고자 하는 사람은 클라우드에 관심을 가져야 한다고 생각한다. 현대의 역사에 남는 머신러닝 모델들은 대략 수억원 이상의 컴퓨팅을 사용하는 것을 심심찮게

finai.tistory.com

 

반응형
Posted by 작동미학