2012년 4월 4일 수요일

/dev/epoll에 대한 연구 위키


3 epoll #
3.1 epoll에 대해서 #
리눅스는 전통적으로 이벤트 기반의 비동기 통지 방식 보다는 동기적으로 관심있어 하는 파일(소켓) 읽기/쓰기 이벤트가 발생했는지를 검사하는 입출력 다중화 방식을 주로 사용해왔다혹은 여러개의 프로세스를 생성시켜서 다중의 클라이언트를 처리하는 방법을 주로 이용해왔다.

이들 방법은 보통 비용이 매우 많이 소비된다입출력 다중화를 위해서 사용하는 select(2), poll(2) 커널과 유저공간사이에 여러번의 데이터 복사가 있을  아니라 이벤트가 발생했는지를 확인하기 위해서 넓은 범위의 소켓테이블을 검사해야 했다select(2)라면 최악의 경우  하나의 이벤트가 어느 소켓에서 발생했는지 확인하기 위해서 1024개의 이벤트 테이블을 몽땅 검색해야 하는 비효율을 감수해야 한다.

이러한 문제를 해결하기 위해서 kqueue, RTS, epoll 같은 이벤트 통지 기반의 입출력 처리 도구가 개발되었다.

epoll 이름에서   있듯이   빠르고 효율적으로 입출력 이벤트의 처리가 가능하도록 poll(2) 확장시킨 도구이다이러한 성능의 향상은 Edge Trigger(ET) Level Trigger(LT) 인터페이스를 채용해서 관심있어 하는 파일을 좀더 효과적으로 관리   있도록 함으로써 이루어 졌다.

다음과 같은 시나리오를 생각해보자

1.      read sid of pipe(RFD) 있는 파일 지정자가 epoll 장치에 추가된다.
2.      Pipe write 2Kb 데이터를 쓴다.
3.      epoll_wait(2) 호출되고 RFD 이벤트가 발생한 파일 정자 리턴한다.
4.      Pipe reader RFD 부터 1Kb데이터를 읽어들인다.
5.      epoll_wait(2) 호출된다.
만약 RFD 파일 지정자가 EPOLLET 플래그를 이용할경우 마지막 단계의 epoll_wait(2) 영원히 반환되지 않을 것이다왜냐하면 위의 단계를 보면  데이터는 2kb인데 반해 읽어들인 데이터는 1kb임을 알수 있다이럴 경우 여전히 파일 입력 버퍼에는 사용할수 있는 데이터가 남아 있게 되고 버퍼를 모두 비우기 전까지는 원격 클라이언트에게 응답(메시지 수신이 끝났다는) 보내지 않게 된다따라서 EPOLLET 플래그를 (Edge Triggerd)  반드시 non-blocking 소켓에 사용해야한다.

epoll Edge Triggered (EPOLLET) 인터페이스를 사용할때는 다음과 같이 사용하도록 하자

1.      non-block 파일디스크립터를 사용한다.
2.      read(2)  write(2)  errno EGAIN 반환할때만 wait  하도록 하자 (epoll_wait)
반대로 Level Triggerd 인터페이스로 epoll 사용할 경우, epoll  항상 poll(2) 보다 빠르고 poll 그대로 대체할  있다. (사용법이 똑같아서) Egde Triggered 방식의 epoll 여러 덩어리의 데이터를 받을  있는것처럼 , EPOLLONESHOT 옵션을 설정할 수도 있다이것은 epoll에게 이벤트를 받은  해당 디스크립터를 감시하는것을 멈추라고 말하는것이다그러므로 이벤트 발생후 파일디스크립터를 다시 장전(?)  책임은 호출자(혹은 프로그래머?) 에게 있다.

3.3 epoll API #
앞장에서 복잡하게프로세스를 설명했지만 프로그래머 입장에서는 단지 3개정도의 관련 함수만 알면 어렵지 않게 epoll응용 어플의 제작이 가능하다.

epoll_create(int size)
epoll_create() 이벤트를 저장하기 위한 size만큼의 공간을 커널에 요청한다커널에 요청한다고 해서 반드시 size만큼의 공간이 확보되는  아니지만 커널이 대략 어느 정도의 공간을 만들어야 할지는 정해줄  있다수행된  파일 지정자 되돌려 주는데  모든 관련작업은 리턴된 파일 지정자 통해서 이루어지게 된다모든 작업이 끝났다면 close() 호출해서 닫아주어야 한다.

int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout)
실제 이벤트가 발생하는걸 기다리고 있다가이벤트가 발생하면 이벤트 관련 정보를 넘겨주는 일을 한다.

epfd epoll_create(2) 이용해서 생성된 epoll지정자이다만약 이벤트가 발생하면 리턴하게 되는데리턴된 이벤트에 관한 정보는 events 저장된다maxevents epoll이벤트 풀의 크기다timeout 기다리는 시간이다. 0보다 작다면 이벤트가 발생할 때까지 기다리고, 0이면 바로 리턴, 0보다 크면 timeout 밀리세컨드 만큼 기다린다만약 timeout시간에 이벤트가 발생하지 않는다면 0 리턴한다.

이벤트가 발생했다면 발생한 이벤트의 갯수를 리턴한다.

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event)
이벤트풀을 제어하기 위해서 사용한다poll(2) 매우 비슷하게 작동한다op fd 대해서 어떤 작업을 할것인지를 정의하기 위해서 사용된다op 실행된 결과는 event구조체에 적용된다.

다음은 epoll_event구조체의 모습이다.
typedef union epoll_data {
     void *ptr;
     int fd;
     __uint32_t u32;
     __uint64_t u64;
} epoll_data_t;

struct epoll_event {
     __uint32_t events;  /* 발생된 이벤트 */
     epoll_data_t data;  /* 유저 데이터로 직접 설정가능하다 */
};
epoll_data_t 유심히 볼필요가 있다이것은 유저 데이터가 직접 설정이 가능한데여기에서 설정한 값은 epoll_wait 통해서 넘어오는 epoll_event구조체값으로 그대로 사용할  있다예를들어 여기에 pid값이라든지 소켓지정번호등을 지정해 놓게되면 나중에 이벤트가 발생했을  이벤트가 발생한 파일등에 대한 정보를 쉽게 얻어올  잇다.

op 다음과 같은 종류의 작업명령들을 가지고 있다poll(2) 비교해보면 매우 유사함을   있을 것이다.
·         EPOLL_CTL_ADD
fd epoll 이벤트 풀에 추가하기위해서 사용한다.
·         EPOLL_CTL_DEL
fd epoll 이벤트 풀에서 제거하기 위해서 사용한다.
·         EPOLL_CTL_MOD
이미 이벤트 풀에 들어 있는 fd 대해서 event 멤버값을 변경하기 위해서 사용한다.
·         EPOLLIN
입력(read)이벤트에 대해서 검사한다.
·         EPOLLOUT
출력(write)이벤트에 대해서 검사한다.
·         EPOLLERR
파일지정자에 에러가 발생했는지를 검사한다.
·         EPOLLHUP
Hang up 발생했는지 검사한다.
·         EPOLLPRI
파일지정자에 중요한 데이터가 발생했는지 검사한다.
·         EPOLLET
파일지정자에 대해서 Edge 트리거 행동을 설정한다. Level 트리거가 기본설정 된다.

6 예제 프로그램 #
epoll시스템 구축을 기념삼아서 간단한 예제프로그램을 만들어 보았다아래 프로그램은 echo서버의 epoll버젼이다. (돌아가기에 급급한 코드다.)
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <sys/epoll.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <fcntl.h>
#include <sys/ioctl.h>

#define SA  struct sockaddr
#define EPOLL_SIZE        20

int main(int argc, char **argv)
{
    struct sockaddr_in addr, clientaddr;
    struct eph_comm *conn;
    int sfd;
    int cfd;
    int clilen;
    int flags = 1;
    int n, i;
    int readn;
    struct epoll_event *events;

    int efd;
    char buf_in[256];

    // 이벤트 풀의 크기만큼 events구조체를 생성한다.
    events = (struct epoll_event *)malloc(sizeof(*events) * EPOLL_SIZE);

    // epoll_create를 이용해서 epoll 지정자를 생성한다.   
    if ((efd = epoll_create(100)) < 0)
    {
        perror("epoll_create error");
        return 1;
    }


    // --------------------------------------
    // 듣기 소켓 생성을 위한 일반적인 코드
    clilen = sizeof(clientaddr);
    sfd = socket(AF_INET, SOCK_STREAM, 0);   
    if (sfd == -1)
    {
        perror("socket error :");
        close(sfd);
        return 1;
    }
    addr.sin_family = AF_INET;
    addr.sin_port = htons(atoi(argv[1]));
    addr.sin_addr.s_addr = htonl(INADDR_ANY);
    if (bind (sfd, (struct sockaddr *)&addr, sizeof(addr)) == -1)
    {
        close(sfd);
        return 1;
    }
    listen(sfd, 5);
    // --------------------------------------

    // 만들어진 듣기 소켓을 epoll이벤트 풀에 추가한다.
    // EPOLLIN(read) 이벤트의 발생을 탐지한다.
    events->events = EPOLLIN;
    events->data.fd = sfd;
    epoll_ctl(efd, EPOLL_CTL_ADD, sfd, events);
    while(1)
    {
        // epoll이벤트 풀에서 이벤트가 발생했는지를 검사한다.
        n = epoll_wait(efd, events, EPOLL_SIZE, -1);
        if (n == -1 )
        {
            perror("epoll wait error");
        }

        // 만약 이벤트가 발생했다면 발생한 이벤트의 수만큼
        // 돌면서 데이터를 읽어 들인다.
        for (i = 0;    i < n; i++)
        {
            // 만약 이벤트가 듣기 소켓에서 발생한 거라면
            // accept를 이용해서 연결 소켓을 생성한다.
            if (events[i].data.fd == sfd)
            {
                printf("Accept\n");
                cfd = accept(sfd, (SA *)&clientaddr, &clilen);
                events->events = EPOLLIN;
                events->data.fd = cfd;
                epoll_ctl(efd, EPOLL_CTL_ADD, cfd, events);
            }5단계에 이른 상태에서 ET에 의해서 아직 읽을 데이터가 있음을 확인하고 이벤트의 발생으로 인해서 epoll_wait(2)가 호출되고 3단계로 넘어가서 다시 데이터를 읽어들인다. 4단계에 이르러서 데이터를 읽어들이면 더이상 버퍼에 아무런 데이터가 남아 있지 않고 5단계에서 락(lock)이 걸리게 된다.

            // 연결소켓에서 이벤트가 발생했다면
            // 데이터를 읽어들인다.
            else
            {
                memset(buf_in, 0x00, 256);
                readn = read(events[i].data.fd, buf_in, 255);
                // read에 문제가 생겼다면 epoll이벤트 풀에서
                // 제거하고 소켓을 닫는다.
                if (readn <= 0)
                {
                    epoll_ctl(efd, EPOLL_CTL_DEL, events[i].data.fd, events);
                    close(events[i].data.fd);
                    printf("Close fd\n", cfd);
                }
                else
                    printf("read data %s\n", buf_in);
            }
        }
    }
}
아래와 같이 컴파일한  테스트 해보기 바란다.
# gcc -o epoll epoll_echo.c  -lepoll


댓글 없음:

댓글 쓰기