공부/정보처리기사

2020년 정보처리기사 실기 정리 #11

셩잇님 2022. 11. 17. 19:10
반응형

운영체제

사용자가 컴퓨터의 하드웨어를 쉽게 사용할 수 있도록 인터페이스를 제공해주는 소프트웨어

 

윈도즈 운영체제 특징 (지선자오)

그래픽 사용자 인터페이스 제공
키보드 없이 마우스로 아이콘이나 메뉴를 선택하여 작업을 수행하는 그래픽 기반의 인터페이스 방식


선점형 멀티태스킹 방식 제공
동시에 여러 개의 프로그램을 실행하면서 운영체제가 각 작업의 CPU 이용 시간을 제어


자동 감지 기능 제공
하드웨어를 설치했을 때 필요한 시스템 환경을 운영체제가 자동으로 구성해주는 기능


OLE 사용
개체를 현재 작성 중인 문서에 자유롭게 연걸 또는 삽입하여 편집할 수 있게 하는 기능 제공

 

유닉스

교육 및 연구 기관에서 사용되는 범용 다중 사용자 방식의 시분할 운영체제

 

유닉스 운영체제 특징 (대다사이계)

대화식 운영체제 기능 제공
프롬프트가 나타낸 상태에서 사용자가 명령을 입력하면 시스템은 그 명령을 수행하는 사용자 명령 기반의 대화식 운영체제 기능을 제공


다중 작업 기능 제공
다수의 작업이 CPU와 같은 공용자원을 나누어 사용해 한 번에 하나 이상의 작업을 수행하는 기능 제공

 

다중 사용자 기능 제공
여러 대의 단말이 하나의 컴퓨터에 연결 되어 여러 사람이 동시에 시스템을 사용해 각각의 작업을 수행할 수 있는 기능 제공

 

이식성 제공
90% 이상 C 언어로 구현되어 있고 시스템 프로그램이 모듈화 되어 있어 다른 하드웨어 기종으로 쉽게 이식 가능

 

계층적 트리 구조 파일 시스템 제공
유닉스 계층적 트리 구조를 가짐으로써 통합적인 파일 관리가 용이

 

리눅스

유닉스르 기반으로 개발되어 소스 코드가 공개된 오픈 소스 기반의 운영체제

 

애플이 유닉스를 기반으로 개발한 그래픽 사용자 인터페이스 기반의 운영체제

 

안드로이드

휴대 전화를 비롯해 휴대 장치를 위한 운영체제와 미들웨어, 사용자 인터페이스, 응용 프로그램을 포함하고 있는 운영체제

 

운영체제 제어 방법

CLI
사용자가 직접 명령어를 입력, 컴퓨터에 명령을 내리는 방식


GUI
마우스로 화면을 클릭해 그래픽 위주로 컴퓨터를 제어하는 방식

 

운영체제 핵심 기능

메모리 관리
프로그램의 실행이 종료될 때까지 메모리를 가용한 상태로 유지 및 관리하는 기능
프로그램 실행 중 메모리가 꽉 차게 되면 시스템의 속도가 느려지고 때로는 시스템이 멈추는 현상이 발생


프로세스 관리
CPU와 데이터를 송수신하는 상황에서 현재 메모리 사용 부분, 입출력 순서, 공간 확보 등 프로세스의 대한 종합적인 관리 기법

 

메모리 관리 기법 (반배할교)

반입 기법
주 기억 장치에 적재할 다음 프로세스의 반입 시기를 결정하는 기법
메모리로 적재 시기 결정
요구/호출 반입 기법


배치 기법
디스크에 있는 프로세스를 주 기억장치의 어느 위치에 저장할 것인지 결정하는 기법
메모리 적재 위치 결정
최초/최적/최악 적합


할당 기법
실행해야 할 프로세스를 주기억장치에 어떤 방법으로 할당할 것인지 결정하는 기법
메모리 적재 방법 결정
연속/분산 할당 기법


교체 기법
재배치 기법으로 주기억장치에 있는 프로세스 중 어떤 프로세스를 제거할 것인지를 결정하는 기법
메모리 교체 대상 결정
프로세스의 SWAP IN/OUT

프로세스 상태 (생준실대완)

생성
사용자에 의해 프로새스가 생성된 상태


준비
CPU 할당받을 수 있는 상태


실행
프로세스가 CPU를 할당받아 동작 중인 상태


대기
프로세스 실행 중 입출력 처리 등으로 CUP를 양도하고 입출력 처리가 완료까지 대기 리스트에서 기다리는 상태


완료
프로세스가 CPU를 할당받아 주어진 시간 내에 완전히 수행을 종료한 상태

 

프로세스 상태 전이 (디타블웨스)

디스패치
준비상태에 있는 여러 프로세스 중 실행될 프로세스를 선정하여 CPU 할당


타이머 런 아웃
CPU를 할당받은 프로세스는 지정된 시간이 초과되면 스케줄러에 의해 PCB 저장, CPU 반납 후 다시 준비상태로 전이됨

 

블록
실행 상태에 있는 프로세스가 지정된 할당시간을 초과하기 전에 입출력이나 기타 사건이 발생하면 CPU를 스스로 반납해 입출력이 완료될때가지 대기 상태로 전이


웨이크 업
어느 순간 입출력이 종료되면 대기 상태의 프로세스에게 입출력 종료 사실을 WAIT & SIGNAL 등에 의해 알려주고 준비 상태로 전이됨


SWAP IN
프로세스가 다시 기억장치가 할당될 경우


SWAP OUT
프로세스가 기억장치를 잃은 경우

 

프로세스 스케줄링

CPU를 사용하려고 하는 프로세스들 사이의 우선 순위를 관리하는 작업

 

프로세스 스케줄링 주요 용어

서비스 시간
프로세스가 결과를 산출하기까지 소요되는 시간


응답 시간
프로세스들이 입력되어 수행하고 결과를 산출하기까지 소요되는 시간


평균 응답시간
대기 큐의 프로세스가 결과를 산출하기 소요되는 시간 평균


대기시간
프로세스가 프로세서에 할당 대기까지 큐에 대기하는 시간


평균 대기시간
프로세스가 대기 큐에서 대기하는 평균 시간


종료시간
요구되는 프로세싱 시간을 모두 수행하고 종료되는 시간


시간 할당량
한 프로세스가 프로세스를 독점하는 것을 방지하기 위해 서비스되는 시간 할당


응답률
(대기시간 + 서비스시간) / 서비스시간

 

프로세스 스케줄링 유형

구분
선점형 스케줄링 (SMMR)
비선점형 스케줄링 (우기 HFS)


개념
선점형 스케줄링 : 하나의 프로세스가 CPU를 차지하고 있을 때, 우선순위가 높은 다른 프로세스가 현재 프로세스를 중단시키고 CPU를 점유하는 스케줄링 방식
비선점형 스케줄링 : 한 프로세스가 CPU를 할당받으면 작업 종료 후 CPU 반환 시까지 다른 프로세스는 CPU 점유가 불가능한 스케줄링 방식

 

장점
선점형 스케줄링 : 비교적 빠른 응답, 대화식 시분할 시스템에 적합
비선점형 스케줄링 : 응답시간 예상이 용이, 모든 프로세스에 대한 요구를 공정하게 처리

 

단점
선점형 스케줄링 : 높은 우선순위 프로세스들이 들어오는 경우 오버헤드 초래
비선점형 스케줄링 : 짧은 작업을 수행하는 프로세스가 긴 작업 종료시까지 대기

 

알고리즘
선점형 스케줄링 : 라운드 로빈, SRT, 다단계 큐, 다단계 피드백 큐
비선점형 스케줄링 : 우선순위, 기한부, FCFS, HAN, SJF

선점형 스케줄링 알고리즘의 유형

라운드 로빈
프로세스는 같은 크기의 CPU 시간을 할당, 할당된 시간 내에 처리하지 못할 시 준비 큐 리스트 가장 뒤로 보내지며, CPU는 대기 중인 다음 프로세스로 넘어감
균등한 CPU 점유시간
시분할 시스템을 사용


SRT
가장 짧은 시간이 소요되는 프로세스를 먼저 수행하고 남은 처리 시간이 더 짧다고 판단되는 프로세스가 준비 큐에 생기면 언제라도 프로세스가 선점됨
짧은 수행시간 프로세스 우선 수행


다단계 큐
작업들을 여러 종류 그룹으로 분할, 여러 개의 큐를 이용해 상위 단계 작업에 의한 하위 단계 작업이 선점
독립된 스케줄링 큐


다단계 피드백 큐
입출력 위주와 CPU 위주인 프로세스 특성에 따라 큐마다 서로 다른 CPU 시간 할당량 부여
FCFS와 라운드 로븐 스케줄링을 혼합한 것으로 새로운 프로세스는 높은 우선순위, 프로세스의 실행시간이 길어질수록 점점 낮은 우선순위 큐로 이동하고 마지막 단계는 라운드 로빈 방식을 적용
큐마다 다른 시간 할당
마지막단계는 라운드 로빈 방식 처리

 

비선점형 스케줄링 알고리즘의 유형

우선순위
프로세스별로 우선순위가 주어지고, 우선순위에 따라 CPU를 할당 만약 동일 순위 일시 FCFS
주요/긴급 프로세스의 대한 우선 처리


기한부
작업들이 명시된 시간이나 기한 내에 완료되도록 계획
요청에 명시된 시간 내 처리를 보장


FCFS
프로세스가 대기 큐에 도착한 순서에 따라 CPU를 할당
FIFO 알고리즘이라고도 함
도착한 순서대로 처리


SJF
프로세스가 도착하는 시점에 따라 그 당시 가장 작은 서비스 시간을 갖는 프로세스가 종료 시 까지 자원 점유
준비 큐 작업 중 가장 짧은 작업부터 수행, 평균 대기 시간 최소
CPU 요구 시간이 긴 작업과 짧은 작업 간의 불평등이 심해 CPU 요구 시간이 긴 프로세스는 기아 현상 발생
기아 현상 발생 가능성


HRN
대기 중인 프로세스 중 현재 응답률이 가장 높은 것을 선택
SJF의 약점인 기야 현상을 보완한 기법으로 긴 작업과 짧은 작업 간의 불평등 완화
HRN의 우선순위 (대기시간 + 서비스시간) / 서비스시간
기아현상 최소화 기법

 

프로세스 스케줄링 알고리즘 계산법 (반종도 대반서)

반환시간 = 종료시간 – 도착시간
대기시간 = 반환시간 – 서비스시간

 

가상화

물리적인 리소스들을 사용자에게 하나로 보이게 하거나 하나의 물리적인 리소스를 여러 개로 보이게 하는 기술

 

가상화 기술요소

컴퓨팅 가상화
물리적으로 컴퓨터 리소스를 가상화하여 논리적 단위로 리소스를 활용할 수 있도록 하는 기술


스토리지 가상화
스토리지와 서버 사이에 SW/HW 게층을 추가해 스토리지를 논리적으로 제어 및 활용할 수 있도록 하는 기술


I/O 가상화
서버와 I/O 디바이스 사이에 위치하는 미들웨어 계층으로, 서버의 I/O 자원을 물리적으로 분리하고 케이블과 스위치 구성을 단순화하여 효율적인 연결을 지원하는 기술


컨테이너
컨테이너화된 애플리케이션들이 단일 운영체제 상에서 실행되도록 해주는 기술


분산처리 기술
여러대의 컴퓨터 계산 및 저장능력을 이용해 커다란 계산문제나 대용량의 데이터를 처리하고 저장하는 기술


네트워크 가상화 기술
물리적으로 떨어져 있는 다양한 장비들을 연결하기 위한 수단으로 중계장치의 가상화를 통한 가상 네트워크를 지원하는 기술

 

클라우딩 컴퓨팅

인터넷을 통해 가상화된 컴퓨터 시스템 리소스를 제공하고, 정보를 자신의 컴퓨터가 아닌 클라우드에 연결된 다른 컴퓨터로 처리하는 기술

 

클라우딩 컴퓨팅 분류 (사공하)

사설 클라우드
기업 또는 조직 내부에서 보유하고 있는 컴퓨팅 자원을 사용해 내부에 구축되어 운영되는 클라우드
자체 컴퓨팅 지원으로 HW, SW, 데이터를 수용


공용 클라우드
다중 사용자를 위한 컴퓨팅 자원 서비스를 제공하는 클라우드


하이브리드 클라우드
사설 클라우드와 공용 클라우드를 모두 사용하는 클라우드

 

클라우드 서비스 유형 (인플소)

인프라형 서비스(IaaS)
서버, 스토리지 같은 시스템 자원을 클라우드로 제공하는 서비스
컴퓨팅 자원에 OS, 어플리케이션 등 SW 탑재 및 실행


플랫폼형 서비스(PaaS)
인프라를 생성, 관리하는 복잡함 없이 애플리케이션을 개발, 실행, 관리 할 수 있게 하는 플랫폼을 제공하는 서비스
SaaS의 개념을 개발 플랫폼에도 확장한 방식으로 개발을 위한 플랫폼을 구축할 필요 없이 필요한 개발 요소를 웹에서 빌려 쓸 수 있게 하는 모델


소프트웨어형 서비스 (SaaS)
SW 및 관련 데이터는 중앙에 호스팅되고 사용자는 웹 브라우저 등의 클라이언트를 통해 접속하여 소프트웨어를 서비스 형태로 이용하는 서비스

 

데이터베이스

다수의 인원 및 시스템 또는 프로그램이 사용할 목적으로 통합하여 관리되는 대이터의 집합

 

파일 시스템 개념

파일에 이름을 부여하고 저장이나 검색을 위하여 논리적으로 그것들을 어디에 위치해야 하는지 등을 정의한 뒤 관리하는 데이터베이스 전 단계의 데이터 관리 방식

 

파일 시스템 종류

ISAM
자료 내용은 주 저장부, 자료의 색인은 자료가 기록된 위치와 함께 색인부에 기록되는 시스템


VSAM
대형 운영체제에서 사용되는 파일 관리시스템

 

계층형 데이터 베이스 관리시스템

데이터를 상하 종속적인 관계로 계층화하여 관리하는 데이터베이스

 

망형 데이터베이스 관리시스템

데이터의 구조를 네트워크상의 망상 형태로 논리적으로 표현한 데이터 모델

 

관계형 데이터베이스 관리시스템

관계형 모델을 기반으로 하는 가장 보편화된 DB 관리 시스템

 

DBMS

데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 변경, 검색, 삭제 및 백업, 복구, 보안 등의 기능을 지원하는 소프트웨어

 

DBMS 유형

키-값 DBMS
키 기반 GET / PUT / DELETE 제공, 메모리 ㄱ반에서 성능 우선 시스템 및 빅데이터 처리 기능 DBMS


컬럼 기반 데이터 저장
KEY안에 컬럼, 벨류 조합으로 된 여러개의 필드를 갖는 DBMS


문서 저장 DBMS
값의 데이터 타입이 문서라는 타입을 사용하는 DBMS


그래프 DBMS
시맨틱 웹과 온톨로지 분야에서 활용하는 그래프로 데이터를 표현하는 DBMS

 

DBMS 특징

데이터 무결성
부적절한 자료가 입력되어 동일한 내용에 대해 서로 다른 데이터가 저장되는 것을 허용하지 않는 성질


데이터 일관성
삽입, 삭제, 갱신, 생성 후에도 저장된 데이터가 변함없이 일정


데이터 회복성
장애가 발생하였을 시 특정 상태로 복구되어야 하는 성질


데이터 보안성
불법적인 노출, 변경, 손실로부터 보호되어야 하는 성질


데이터 효율성
응답 시간, 저장 공간 활용 등이 최적화되어 사용자, 소프트웨어, 시스템 등의 요구 조건을 만족시켜야 하는 성질

 

ERD 개념

업무 분석 결과로 도출된 실체(엔티티)와 엔티티 간의 관계를 도식화한 다이어그램

 

엔티티

사물 또는 사건으로 정의되며 개체라고도 한다.

 

속성

엔티티가 가지고 있는 요소 또는 성질

 

트랜잭션

인가받지 않은 사용짜로부터 데이터를 보장받기 위해 DBMS 가져야 하는 특성이자, 데이터베이스 시스템에서 하나의 논리적 기능을 정상적으로 수행하기 위한 작업의 기본 단위

 

트랜잭션의 특징 (ACID, 원일격영)

유형
설명
주요기법

 

유형 : 원자성
설명 : 분해가 불가능한 작업의 최소 단위, 연산 전체가 성공 또는 실패 중 하나라도 실패할 경우 전체가 취소되어야 함
주요 기법 : COMMIT / ROLLBACK, 회복성 보장

 

유형 : 일관성
설명 : 트랜잭션이 실행 성공 후 항상 일관된 데이터베이스 상태를 보존해야 함
주요 기법 : 무결성 제약조건, 동시성 제어

 

유형 : 격리성
설명 : 트랜잭션 실행 중 생성하는 연산의 주안 결과를 다른 트랜잭션이 접근 불가
주요 기법: read Uncommit, commit, repeatable read, serializable read

 

유형 : 영속성 (지속성)
설명 : 성공이 완료된 트랜잭션의 결과는 영속적으로 데이터베이스에 저장
주요 기법 : 회복기법

 

트랜잭션의 상태 설명

활동 상태
초기 상태, 트랜잭션이 실행 중일 때 가지는 상태


부분 완료 상태
마지막 명령문이 실행된 후에 가지는 상태


완료 상태
트랜잭션이 성공적으로 완료 된 후 가지는 상태


실패 상태
정상적인 실행이 더 이상 진행될 수 없을 때 가지는 상태


철회 상태
트랜잭션이 취소되고 데이터베이스가 트랜잭션 시작 전 상태로 환원된 상태

 

트랜잭션 제어

커밋
트랜잭션 확정
트랜잭션을 메모리에 영구적으로 저장


롤백
트랜잭션 취소
트랜잭션을 내역을 저장 무효화시킴


체크포인트
저장시기 결정
rollback을 위한 시점을 저장

 

데이터베이스 기본 연산 (CRUD, 세인업데)

연산 : 읽기(READ)
기본 처리 : 조회
SQM DML : SELECT
설명 : 테이블 내 컬럼에 저장된 데이터를 불러옴


연산 : 생성(CREATE)
기본 처리 : 삽입
SQM DML : INSERT
설명 : 테이블 내 컬럼에 데이터를 추가


연산 : 갱신(UPDATE)
기본 처리 : 갱신
SQM DML : UPDATE
설명 : 테이블 내 컬럼에 저장된 데이터를 수정


연산 : 삭제(DELETE)
기본 처리 : 삭제
SQL DML : DELETE
설명 : 테이블 내 컬럼에 저장된 데이터를 삭제

 

SELECT(데이터 조회) 명령문

SELECT 절
검색하고자 하는 속성명, 계산식, 술어 부분은 ALL이 기본값
2개 이상의 테이블은 대상으로 검색할 때는 테이블명, 속성명으로 표현
술어(ALL) : 모든 튜플을 검색할 때 사용, SELECT 뒤에 명시하지 않을 경우 ALL로 인식
술어(DISTINCT) : 중복된 속성이 조회될 경우 그 중 한 개만 검색
술어(DISTINCTROW) : SELECT 뒤에 속성들과 상관없이 튜플 전체가 중복된 튜플을 제거


FROM 절
질의에 의해 검색될 데이터들을 포함하는 테이블 명을 기술


WHERE 절
검색할 조건을 기술


GROUP BY 절
속성값을 그룹으로 분류하고자 할 때 사용


HAVING 절
GRUOP BY에 의해 분류한 후 그룹에 대한 조건 지정


ORDER BY 절
속성 값을 정렬하고자 할 때 사용 (ASC : 오른차순, DESC : 내림차순, 키워드 생략시 오름차순 정렬)

 

WHERE 절

비교, 범위, 집합, 패턴, NULL, 복합조건 등을 다룬다.

 

구분
연산자
사례

 

구분 : 비교
연산자 : =, <>, <, <=, >, >=
사례 : PRICE < 5000, 가격이 50000 미만

 

구분 : 범위
연산자 : BETWEEN
사례 : PRICE BETWEEN 5000 AND 8000 (가격이 5000보다 크거나 같고 8000보다 작거나 같음)

 

구분 : 집합
연산자 : IN, NOT IN
사례 : PRICE IN (40000, 50000, 60000) (가격이 40000, 50000, 60000)

 

구분 : 패턴
연산자 : LIKE
사례 : NAME LIKE ‘정보%’ 이름이 정보로 시작되는 문자열
NULL, IS NULL, IS NOT NULL, PRICE IS NULL 가격 값이 NULL일 경우

 

구분 : 복합조건
연산자 : AND, OR, NOT
사례 : PRICE < 50000 AND (NAME LIKE ‘정보%’) (가격이 50000 미만이고 이름이 ‘정보’로 시작 되는 문자열)

 

INSERT (데이터 삽입) 명령문

INSERT INTO 테이블명(속성명1, ...)


VALUES(데이터1, ...)속성과 데이터 개수, 타입이 일치해야 함. 속성명 생략가능

 

UPDATE (데이터 변경) 명령문

UPDATE 테이블명
SET 조견명 = 데이터, ...
WHERE 조건;


UPDATE 명령문은 WHERE 절을 통해 어떤 조건이 만족할 경우에만 특정 컬럼의 값을 수정하는 용도로 자주 사용됨

 

DELETE (데이터 삭제) 명령문

DELETE FROM 테이블명
WHERE 조건;

 

모든 레코드를 삭제할 때는 WHWERE 절이 없이 DELETE 만 사용
레코드를 삭제해도 테이블 구조는 남아 있어서 디스크에서 테이블을 완전히 삭제하는 DROP문과는 다름

 

빅테이터

시스템, 서비스, 조직 등에서 주어진 비용, 시간 내에 처리 가능한 데이터 범위를 넘어서는 페타바이트 크기의 비정형 데이터이다.

 

빅데이터 특징 (양다속)

데이터의 양
페타바이트 수준의 대규모 데이터, 빅테이터 분석 규모에 관련된 특성
디티절 정보량이 기하급수적으로 폭증하는 것을 의미


데이터의 다양성
정형, 비정형, 반정형의 다양한 데이터, 빅데이터 자원 유형에 관련한 특성
로그, 소셜, 위치 등 데이터 유형이 다양해지는 것을 의미


데이터의 속도
빠르게 증가하고 수집되며, 처리되는 데이터
가치 있는 정보 활용을 위해 실시간 분석이 중요해지는 것을 의미

 

빅데이터 수집, 저장, 처리 기술

비정형/반정형 데이터 수집
내, 외부 정제되지 않은 데이터를 확보, 이를 통해 필요 정보를 추출하여 활용하기 위해서 효과적으로 수집 및 전송하는 기술
EX) 척와, 플럼, 스크라이브


정형 데이터 수집
내 외부 정제된 대용량 데이터의 수집 및 전송 기술
EX) TEL, FTP, 스쿱, 하이호


분산데이터 저장/처리
대용량 파일의 효과적인 분산 저장 및 분산 처리 기술
EX) HDFS, 맵 리듀스


분산데이터 베이스
HDFS의 칼럼 기반 데이터 베이스로 실시간 랜덤 조회 및 업데이트 가능한 기술
EX) HBASE

 

NOSQL

전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어로 데이터 저장에 고정된 테이블 스키가마 필요하지 않고 조인 연산을 사용할 수 없으며 수평적으로 확장이 가능한 DBMS

 

NOSQL의 특성

Basically Available
언제든지 데이터는 접근할 수 있어야 하는 속성
분산 시스템이기 때문에 항상 가용성 중시


Soft-State
노드의 상태는 내부에 포함된 정보에 의해 결정되는 것이 아니라 외부에서 전송된 정보를 통해 결정디는 속성
특정 시점에서는 데이터의 일관성이 보장되지 않음


Eventually Consistency
일관성을 중시하고 지향, 일정 시간이 지나면 데이터의 일관성이 유지되는 속성

 

NOSQL의 유형

key-value store
Unique한 key에 하나의 value를 가지고 있는 형태
키 기반 get/ put/ delete 제공하는 빅데이터 처리 가능 db


column family data store
key 안에 column, value 조합으로 된 여러 개의 필드를 갖는 db
테이블 기반, 조인 미지원, 컬럼 기반, 구글의 bigtable 기반으로 구현


document store
value의 데이터 타입이 document라는 타입을 사용하는 db


graph store
시맨틱 웹과 온톨로지 분야에서 활용되는 그래프로 데이터를 표현하는 db

 

데이터 마이닝

대규모로 저장된 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술

 

데이터 마이닝 절차 (목데가마검)

1단계
목적 설정
데이터 마이닝을 통해 얻고자 하는 명확한 목적 설정


2단계
데이터 준비
거래 정보, 웹로그 데이터 고객 정보 등 다양한 데이터 활용
사전에 운영 데이터 접근에 따른 부하 고려


3단계
가공
모델링 목적에 따라 목적 변수 정의
필요한 데이터를 데이터 마이닝 소프트웨어에 적용할 수 있는 형식으로 가공 처리


4단계
마이닝 기법 적용
1단계의 명확한 목적에 맞도록 데이터 마이닝 기법을 적용하여 정보 추출


5단계
정보 검증
데이터 마이닝으로 추출된 정보 검증

 

데이터 마이닝 주요 기법

분류 규칙
과거 데이터로부터 특성을 찾아내어 분류 모형을 만들어 이를 토대로 새로운 레코드 결과 값을 예측하는 기법


연관 규칙
데이터 안에 존재하는 항목들 간의 종속 관계를 찾아내는 기법


연속 규칙
연관 규칙에 시간 정보가 포함된 형태의 기법


데이터 군집화
대상 레코드들을 유한 특성을 지닌 몇 개의 소그룹으로 분할하는 작업으로 작업의 특성이 분류규칙과 유사

 

네트워크

원하는 정보를 원하는 수신자 또는 기기에 정확하게 전송하기 위한 기반 인프라

 

네트워크 장비 – 1계층

허브
여러 대의 컴퓨터를 연결해 네트워크로 보내거나 하나의 네트워크로 수신된 정보를 여러 대의 컴퓨터로 송신하기 위한 장비


리피터
디지털 신호를 증폭시켜 주는 역할을 하여 신호가 약해지지 않고 컴퓨터로 수신되도록 하는 장비

 

네트워크 장비 – 2계층

브리지
두 개의 근거리 통신망을 서로 연결해 주는 통신망 연결 장치


L2 스위치
브리지와 허브의 단점을 개선하기 위해 출발지에서 들어온 프레임 목적지 MAC 주소 기반으로 빠르게 전송시키는 데이터 링크 계층의 통신 장치

L2 스위치는 종류에 따라 3가지 방식 중 하나를 사용
Store and forwarding : 데이터를 전부 받은 후 다음 처리를 하는 방식
cut through : 데이터 목적지 주소만 확인 후 바로 전송 처리하는 방식
fragment free : 프레임의 앞 64바이트만을 읽어 에어를 처리하고 목적지 포트로 전송하는 방식

 

NIC
외부 네크워크와 접속하여 가장 빠른 속도로 데이터를 주고 받을 수 있께 컴퓨터 내에 설치되는 장치

 

스위칭 허브
스위치 기능을 가진 허브

 

네트워크 장비 – 3계층

라우터
LAN과 LAN을 연결하거나 LAN과 WAN을 연결하기 위한 인터넷 네트워킹 장비
패킷의 위치를 추출해 그 위치에 대한 최적의 경로를 지정해 경로에 따라 데이터 패킷을 다음 장치로 전송시키는 장비

 

게이트 웨이
프로토콜을 서로 다른 통신망에 접속할 수 있게 해주는 장치

 

L3 스위치
3계층에서 네트워크 단위들을 연결하는 통신 장비 (라우터와의 경계가 모호하다)


유무선 인터넷 공유기
외부로부터 들어오는 인터넷 라인을 유선으로 여러 대의 기계를 연결하거나 무선 신호를 송출해 여러 대의 컴퓨터가 하나의 인터넷을 공유할 수 있도록 하는 장비


망 스위칭 허브
광역 네트워크를 커버하는 스위칭 허브

네트워크 장비 – 4계층

L4 스위치
4계층에서 네트워크 단위들을 연결하는 통신 장비
UDP, TCP 등 스위칭 수행, FTP HTTP 등을 구분해 스위칭하는 로드 밸런싱 기능

 

프로토콜

서로 다른 시스템이나 기기들 간의 데이터 교환을 원활히 하기 위한 표준화된 통신 규약

 

프로토콜의 기본요소(구의타)

구문 : 시스템 간의 정보 전송을 위한 데이터 형식, 코딩, 신호 레벨 등의 규정
의미 : 시스템 간의 정보 전송을 위한 제어 정보로 조정과 에러 처리를 위한 규정
타이밍 : 시스템 간의 정보 전송을 위한 속도 조절과 순서 관리 규정

 

네트워크 프로토콜

컴퓨터나 원거리 통신 장비 사이에서 메시지를 주고받는 양식과 규칙의 체계

 

프로토콜의 특징

단편화
전송이 가능한 작은 블록으로 나누어지는 기법


재조립
단편화되어 온 조각들을 원래 데이터로 복원하는 기법


캡슐화
상위 계층의 데이터에 각종 정보를 추가해 하위 계층으로 보내는 기법


연결 제어
단말기와 프로세스 간 자료 전송과 오류 발생을 제어하여 메시지 전달에 확실성을 부여하기 위한 절차


오류 제어
전송 중 잃어버리는 데이터나 오류가 발생한 데이터를 검증하는 기법


동기화
송신과 수신 측의 시점을 맞추는 기법


다중화
하나의 통신 회선에 여러 기기들이 접속할 수 있는 기술


주소 지정
송신과 수신지 주소를 부여해 정확한 데이터 전송을 보장하는 기법

 

TCP

인터넷 프로토콜 스위트의 핵심 프로토콜 중 하나로 IP와 함께 TCP / IP라는 명칭으로 사용된다.

 

TCP의 특징 (신연흐흔)

신뢰성 보장
패킷 손실, 중복, 순서 바꿈 등이 없도록 보장


연결 지향적 특징
같은 전송계층의 UDP가 비연견결성인것과는 달리, TCP는 연결 지향적


흐름 제어
흐름 제어 기능을 활용해 송신 및 수신 속도를 일치시킴


혼잡 제어
네트워크가 혼잡하다고 판단될 때는 혼잡제어 기법을 사용해 송신율을 감속

 

UDP

비연결성이고, 신뢰성이 없으며, 순서화되지 않은 데이터그램 서비스를 제공하는 전송 계층의 통신 프로토콜

 

UDP 특징 (비순실단)

비신뢰성
데이터그램 지향의 전송계층용 프로토콜


순서화되지 않은 데이터그램 서비스 제공
수신된 메시지의 순서를 맞추지 않음


실시간 응용 및 멀티태스킹 기능
빠른 요청과 응답이 필요한 실시간 응용에 적합


단순 헤더
헤더는 고정 크기의 8바이트

 

IPV4

인터넷에서 사용되는 패킷 교환 네트워크상에서 데이터를 교환하기 위해 32BIT 주소체계를 갖는 네트워크 계층의 프로토콜

 

IPV6

인터넷 프로토콜 스택 중 네트워크 계층의 프로토콜로서 버전 6 인터넷 프로콜로 제정된 차세대 인터넷 프로토콜을 말한다.

 

패킷 스위칭

컴퓨터 네트워크와 통신의 방식 중 하나로 작은 블록의 패킷으로 데이터를 전송해 데이터를 전송하는 동안 네트워크 자원을 사용하도록 하는 통신 방식

 

X.25

통신을 원하는 두 단말장치가 패킷 교환망을 통해 패킷을 원할히 전달하기 위한 통신 프로토콜

 

ATM

비동기 전솜모드라고 하는 광대역 전송에 쓰이는 스위칭 기법

 

ATM 계층

AAL
패킷을 작은 조각인 셀로 전송한 후 다시 조립하여 원래의 데이터로 복원하는 역할을 담당


ATM 계층
셀과 셀 전송 역할을 담당, 셀의 레이아웃을 정의하고 헤더 필드가 의미하는 것을 알려줌
가상 회선이 연결 및 해제, 혼잡 제어 처리


물리 계층
물리적 전송 매체를 처리하는 역할을 담당

 

서킷 스위칭

네트워크 리소스를 특정 사용층이 독점하도록 하는 통신 방식

 

라우팅 알고리즘 – 거리 벡터 알고리즘

인접 라우터와 정보를 공유하여 목적지까지의 거리와 방향을 결정하는 라우팅 프로토콜 알고리즘이다.
벨만 포드 알고리즘을 사용 한다.

 

라우팅 알고리즘 – 링크 상태 알고리즘

링크 상태 정보를 모든 라우터에 전달하여 최단 경로 트리를 구성하는 라우팅 프로토콜 알고리즘이다.
다익스트라 알고리즘을 사용한다.

 

라우팅 프로토콜의 종류

RIP
최초의 라우팅 프로토콜, 거리 벡터 알고리즘 활용
30초 주기로 전체 라우팅 정보 갱신, 변화 업데이트 시 많은 시간 소요


LGRP
RIP의 문제점 개선을 위해 시스코에서 개발
네트워크 상태를 고려해 라우팅


OSPF
링크 상태 알고리즘 사용, 발생한 변경 정보에 대해 RIP보다 빠른 업데이트
토폴로지에 대한 정보가 전체 라우터에 동일하게 유지


BGP
규모가 큰 네트워크의 상호 연결, 대형 사업자 간의 상호 라우팅

 

개발환경 인프라 구성 방식

온미프레스 방식
외부 인터넷망이 차단된 상태에서 인트라넷망만을 활용해 개발 환경을 구축하는 방식


클라우드 방식
클라우드 공급 서비스를 하는 회사들의 서비스를 임대해 개발 환경을 구축하는 방식


하이브리드 방식
온미프레스와 클라우드 방식을 혼용한 방식

클라우드 기반 개발 인프라 구축

컴퓨팅 환경
프로그램을 설치하고 운용할 하드웨어 장비를 세팅


웹 기반 서비스 운용을 위한 웹서버
데이터 관리와 백업 등을 위한 DBMS 서버


스토리지
대규모 데이터를 저장, 관리, 전송, 이중화하기 위한 저장 장치 세팅


클라우드 기반 스토리지 세팅
데이터 안전성 향상을 위한 아카이브 스토리지 세팅


데이터베이스
실데이터를 저장하고 관리하기 위한 DB 세팅

고성능형 관계형, 인메모리 데이터베이스 세팅
대규모 데이터 운영을 위한 웨어하우징 세팅


네트워킹 전송
구성된 서비스, 프로그램, 콘텐츠를 효율적으로 전달하기 위한 환경 세팅

콘텐츠 전소용 CDN 구축, API 제공용, 대규모 로드 밸런싱 환경 구축


개발자 도구
프로그램을 실제 개발하기 위한 제반 환경 구축


애플리케이션 개발 및 배포환경 구축
소스코드를 손실 없이 관리하기 위한 저장소 구축

코드 개발 테스트를 위한 환경 구축

 

보안 환경 구축
외부의 침입으로부터 시스템과 데이터를 보호하기 위한 환경 구축


사용자 액세스 및 암호화 관리, 앱 자격 증명 환경 구축
각종 인증서 프로비저닝, 관리 및 배포
악성 트래픽 필터링 서비스 관리


응용 기술 세팅
증강 현실, 가상 현실, 머신러닝, 딥러닝, 사물인터넷 개발을 위한 환경 세팅


생산성 향상
시스템 볼룸, 실시간 스트리밍 서비스, 비즈니스, 운영 상태 분석 서비스 구축

반응형