RESEARCH & STUDY

SEMINAR

Introduction of Network

26 FEB 2017

링크 : 21세기를 지배하는 네트워크 과학

알버트 라즐로 바라바시가 쓴 『링크』는 네트워크 이론을 통해 복잡계의 본질을 파헤치는 과학서적이다. 바라바시는 현재 미국 노트르담 대학의 물리학과 종신교수로 재직중인데, 30대 중반의 나이를 고려하면 그의 업적과 위상을 짐작할 수 있다. 2002년 출판되자마자 폭발적인 반응과 함께 곧바로 베스트셀러가 된 이 책은 어려운 네트워크 이론을 평이한 예제를 중심으로 설명하여, 과학에 문외한인 일반인들도 쉽게 이해할 수 있게 구성되어있는 것이 큰 장점이라고 할 수 있다. 바라바시는 기존의 복잡계 네트워크 이론에 소위 '척도없는 네트워크(Scale Free Network)’개념을 최초로 도입하였는데, 이 개념은 자연과학뿐만 아니라 경제학, 사회학 등 과학계 전반에서 큰 반향을 불러일으키고 있다. 여기서 ‘척도없는’은 복잡계의 네트워크에 어떤 구성원리가 있다는 의미를 수학적으로 표현한 용어이다. 지금까지의 이론들은 복잡계 네트워크에서 어떠한 규칙성이나 일관된 규칙을 찾아낼 수 없는 완전히 무작위적인(Random) 세계라고 가정하고 있다. 즉 무질서의 세계, 무규칙의 세계로 알고 있던 수많은 복잡계들이 사실은 규칙의 세계이며, (어느 정도는) 질서가 있는 세계라는 큰 패러다임의 전환이라고 할 수 있다.

네트워크 이론 발달 순서

무작위 네트워크

폴 에르되스(Paul Erdos)와 알프레드 레니(Alfred Reney)가 함께 쓴 논문에서 무작위 네트워크 이론이 등장한다. 인류 역사상 처음으로 우리의 상호연결된 세계를 이해하기 위한 가장 근본적인 문제를 다루고 있다.

에르되스-레니의 주장

링크를 무작위적으로 부여해 나가게 되면 어떤 노드들은 다른 노드들보다 많은 링크를 갖게 될 것이다. 어떤 노드는 하나의 링크도 갖지 못하게 될 수도 있다. 하지만 에르되스와 레니는 그렇게 보일 뿐이라 주장한다. 만약 네트워크가 커지게 되면, 링크를 완전히 무작위적으로 부여하더라도 거의 모든 노드들은 같은 수의 링크를 갖게 될 것이라는 뜻이다. 그리고, 전체가 모두 연결되기 위해서는 노드당 오직 하나의 링크만 있어도 충분하다고 말한다.

무작위 네트워크 증명

처음에는 서로들 간에 전혀 모르는 손님 10명이 참석한 파티에서, 손님들이 소규모 그룹 단위로 이야기를 하기 시작하면서 사회적 연결(tie)들이 형성된다. 처음에는 그 각각의 그룹 내에는 사회적 링크(선으로 표시됨)들이 존재하지만, 그 그룹 외부의 사람들은 모두 낯선 사람들이다. 시간이 가면서(오른쪽 그림) 세 명의 손님이 다른 그룹으로 이동하자 커다란 클러스터(cluster)가 생겨난다. 모든 사람이 다른 사람을 직접 할게 되는 것은 아니지만, 이제 모든 손님을 포괄하는 단일한 사회적 네트워크가 등장한 것이다. 이러한 사회적 링크들을 따라가면 어떤 두명의 손님 간에도 연결 경로가 존재하게 된다. 칵테일 파티를 떠나는 모든 손님들에게 새로운 사람을 몇 명이나 사귀었냐고 물어보니 평균이 종형 곡선을 이루었다.

<무작위 네트워크의 그래프 (포와송 그래프)>

무작위 네트워크 그래프는 정점을 가지고 있으며, 대다수의 노드들이 거의 같은 개수의 링크를 갖고 있다. 정점 양쪽 사면에는 분포가 급격히 감소하는데, 이는 평균으로부터 상당히 멀리 떨어진 경우는 극히 드물다는 것을 의미하며, 네트워크 적으로 봤을 때, 대개 평균이 보통인 매우 고른 네트워크를 얻게 된다. 즉, 무작위적 세계는 평균에 의해 지배되는 세계라고 할 수 있다.

척도없는 네트워크

와츠-스트로가츠가 클러스터링에 대한 단순화된 설명을 제공하여, 무작위 네트워크와 클러스터링을 묶어 놨었지만, 커넥터와 허브의 등장이 다시 이 현상 유지에 도전을 한다.

웹의 링크 개수 측정

웹의 가시성(visibility)의 척도는 링크의 개수인데, 웹페이지로 들어오는 링크가 많으면 많을수록 가시적이다. 저자인 바라바시는 로봇을 웹에 풀어 놓고 웹 페이지가 몇개의 링크를 가지고 있는지 알아보는 실험을 했다. 전체 중에서 90%에 해당하는 대다수의 문서는 10개 이하의 링크를 받고 있는 반면, 3개의 극소수 페이지는 100만 이상의 링크를 받아들이고 있었다. 웹에는 허브(hub)가 존재한다는 것을 알 수 있으며, 허브는 전체 네트워크의 구조를 지배하고 네트워크를 좁은 세상으로 만드는 역할을 한다. 웹페이지들이 갖고 있는 링크의 분포가 멱함수 법칙(power law)이라고 불리는 수식을 정확하게 따르고 있음을 발견했다.

네트워크는 멱함수의 법칙을 따르는데, 멱함수가 특징적 노드가 없어 내재적인 척도가 없기 때문에 네트워크에 이름을 ‘척도 없는 네트워크’라 지었다.

<척도없는 네트워크의 그래프 (멱함수)>

척도없는 네트워크의 특징

척도없는 위상구조는 현실 네트워크들의 끊임없이 성장하는 속성의 자연스러운 결과이다. 두개의 연결된 노드들로부터 출발하여(위쪽 맨 왼쪽), 각 네모 속에는 하나의 새로운 노드(흰생 노드로 표현됨)가 네트워크에 추가된다. 어느 노드에 링크할 것인가를 결정함에 있어서, 새 노드는 연결선 수가 많은 노드를 선호한다. 성장과 선호적 연결 덕분에 연결선 수가 매우 많은 소수의 허브가 생겨난다.

  1. 1. 성장(Growth) 네트워크 구성요소의 수가 점점 많아지고, 구성요소간의 연결이나 상호작용의 관계도 점점 조밀해진다는 것이다. 복잡계들이 처음부터 현재와 같은 많은 수의 구성요소들을 가지고 '태어나는' 것이 아니라는 것이다. ex) 세포 분열
  2. 2. 선호적 연결(Preferentail Attachment) 네트워크가 성장할 때 무작위적으로 상호작용관계(링크)를 형성하는 것이 아니라 어떤 선호하는 기준을 가지고 있다는 의미이다. 그 기준은 물론 네트워크의 특성 또는 궁극적인 목적에 따라 결정될 것이다. 선호적 연결은 네트워크의 초기조건과 관련된 원리라고 할 수 있다. ex) 허브 공항
  3. 3. 적합성(Fitness) 환경에 적합하면 비록 초기에는 선호기준에서 불리하더라도 더 빨리 상호작용관계를 형성할 수도 있다는 것이다. 이는 상호작용관계가 형성되는 속도와 관련된 것이란 점을 알 수 있다. 절대로 패할 것 갖지 않던 시장의 독보적인 선두기업이 어느 순간에 이름도 없던 후발주자에게 선두자리를 내 놓는 것을 우리는 종종 볼 수 있다. ex) 구글

인터넷의 탄생과 위상구조

네트워크의 패러다임의 변화를 추적하고, 척도 없는 네트워크의 특성을 알 수 있도록 해준 것을 인터넷이 제공한 데이터의 힘이다. 인터넷 네트워크를 통해 새롭게 발견된 지식들은 유행이나 에이즈 등 척도 엇는 네트워크의 모든 종류의 확산을 새로운 시각에서 다시 한번 들여다 보게 만들었다. 인터넷의 네트워크적 속성을 살펴보자.

1964년 폴 배런은 인터넷에 맞는 최적의 구조를 모색하기 시작했다. 그는 네트워크의 구조를 세 가지 유형 - 중앙집중형, 탈집중형 및 분산형 - 으로 구분하고, 그 당시 주류를 이루던 중앙집중형과 탈집중형 통신망은 공격에 대해 너무나 취약한 구조라고 경고했다. 나아가 기존의 통신망과는 달리 인터넷은 그물 모양의 분산 구조를 갖도록 설계되어야 한다고 주장했다.

<폴 배런이 제시한 네트워크 유형>

전 세계의 인터넷 지도를 작성하고자 하는 노력은 인터넷의 위상구조를 제대로 파악하지 않고서는 보다 나은 도구와 서비스를 설계하는 것이 불가능하기 때문이다. 또한, 인터넷의 기본 구조는 그대로이지만 오늘날 우리가 인터넷을 사용하는 모습은 처음 설계했던 사람들의 상상을 초월해 성장하고 있기 때문이다.

2000년, 파루소스 형제(미갈리스 파루소스, 페트로스 파루소스, 리스토스 파루소스)가 “인터넷 위상구조의 멱함수 법칙 관계” 논문에서 다양한 물리적 회선으로 연결된 라우터들의 집합체인 인터넷이 척도 없는 네트워크라는 점을 증명했다.

* 위상 구조는 공간 관계를 명시적으로 정의하는 것으로서, 인접, 연결, 포함, 근접으로 표현되는 지리적 도형 간 관계의 수학적 기술. 따라서 점은 지역 내부에 존재하며, 선은 다른 것과 연결될 수 있고, 지역은 근린을 포함할 수 있다. 이러한 위상 구조에 의해 다각형 분해, 중첩, 네트워크 분석, 최적 노선 선택 등의 공간 분석 기능 등 유리한 점이 많다. 위상 구조를 정의함으로써 많은 양의 자료를 빠르게 처리할 수 있다. 또한 여러 분석 기능을 수행할 수 있으며, 유사한 성격을 갖는 다각형을 결합할 수도 있고, 중첩과 식별이 용이하다.

우리의 행동을 지배하는 네트워크

1968년 겨울 오후, 심리학자 스탠리 밀그램은 1~15명의 ‘자극 군중’을 미리 인도에 배치해두고, 보행자의 행동을 관찰했다. 신호를 보내면 자극 군중은 가던 길을 멈추고 근처 건물의 6층 창문을 정확하게 1분 동안 올려다보았다. 그 결과 보행자 중 4%는 자극 군중이 11명일 때 함께 멈춰 섰으며, 보행자의 40%는 자극 군중이 15명일 때 멈춰 섰다. 보행자가 어떤 행동을 모방하는 결정은 그 행동을 하는 군중의 크기에 영향을 받는다.

모든 소셜 네트워크가 기본적으로 지닌 두 가지 측면 중 첫번째는 연결이다. 연결은 어떤 구성원을 다른 구성원과 이어주는 것이고, 두번째 전염은 유대를 통해 흘러가는 것이다. 소셜 네트워크가 왜 존재하고 어떻게 작용하는지 이해하려면, 소셜 네트워크의 연결과 전염에 관한 일부 규칙들을 이해 하는 게 필요하다.

소셜 네트워크를 지배하는 규칙

규칙 01

우리의 네트워크는 자신이 만들어낸다. 동류 선호(homophily) - 사람들은 관심사와 살아온 역사와 꿈이 같은 사람에게 동질감과 애착을 느낀다.

네트워크를 선택할 때 사용하는 중요한 방식

  1. 1 자신이 얼마나 많은 사람과 연결을 맺을 것인지 결정한다.
  2. 2 우리는 친구들과 가족들의 상호 연결에 영향을 미친다.
  3. 3 우리는 소셜 네트워크에서 자신의 중심성을 조절한다.

이행적 관계

  • - 이행성이 높다 : 한 집단에 깊이 뿌리를 두고 있음
  • - 이행성이 낮다 : 잘 모르는 여러 집단의 사람들과 접촉하는 경향이 있음
규칙 02

네트워크가 우리를 빚어낸다. 네트워크에서 우리가 차지하는 위치는 우리 자신에게 영향을 미친다.

  1. 1 사회적 접촉의 수
  2. 2 친구들과 그 밖의 사회적 접촉 대상이 서로 친구냐 아니냐 하는 것 (=이행성)
    예) 이혼이 어린이에게 미치는 영향
  3. 3 친구와 가족이 접촉 대상을 얼마나 많이 갖고 있느냐 (=중심성)
규칙 03

친구들은 우리에게 영향을 미친다.

규칙 04

친구의 친구의 친구도 우리에게 영향을 미친다. ‘양자 관계를 넘어선 확산’이 일어난다. ex) 자극 군중

복잡한 네트워크에서 어떤 일이 일어나는지 해독하기 위해서 필요한 정보

  1. 1 단순한 양자 관계를 뛰어넘어서 바라볼 필요가 있다.
  2. 2 한 시점이 아니라 많은 시점에 대한 것이 필요하다.
규칙 05

네트워크는 자체 생명력이 있다. 소셜 네트워크는 창발적* 성질을 가진다. ex) 파도타기