프린트
파이썬과 R 을 활용한 빅데이터 머신러닝 전문가 양성자 과정

  • 훈련과정 : 파이썬과 R 을 활용한 빅데이터 머신러닝 전문가 양성자 과정
  • 훈련비용 : 0원(국가기간 전략산업직종훈련 / 전액국비지원)
  • 훈련직종 : 정보시스템구축
  • 훈련코드 : 11-01-007
  • 교육일정 : 2017년 11월 03일 - 2018년 05월 04일
  • 교육시간 및 총시간 : 09:30 ~18:30(총 992시간)
  • 훈련정원 : 30명
  • 훈련강사 : 홍창식
1. 교육개요
  • 2007년 아이폰의 등장으로 시작된 스마트폰 열풍은 우리에게 또 다른 생활 패턴을 가져왔습니다. 스마트폰은 우리를 24시간 365일 세상과 연결시켜주면서 우리가 상식적으로 생각할 수 있는 모든 것들을 손바닥 위에 올려놓았습니다. 이제 우리에게 몰려올 다음 파도는 인공지능입니다. 인공지능은 또 다른 방식으로 우리의 산업과 생활을 변화 시킬 것입니다. 이미 빅데이터를 활용하여 분석 솔루션을 개발하는 기업들에서는 인공지능의 기반이 되는 머신러닝에 대한 기본 지식을 가진 인력을 필요로 하고 있습니다. 그리고 그 필요는 점점 늘어날것으로 예상되고 있습니다. 더 퓨쳐리스트 편집자이자 미래학자인 토머스 프레이는 2030년까지 20억개의 일자리가 없어지고 포춘 500 대 기업 가운데 절반은 문을 닫을 것이라고 예측했습니다. 일자리 20억개는 세계 일자리의 절반에 해당하는 수치입니다. 그 원인으로는 인공지능과 로봇기술의 발달을 지목했습니다.

    인공지능 관련 사업의 시장규모는 2016년 현재 1200억 달러 수준이지만 2024년이면 3조 달러에 이를것으로 전망된다고 합니다. 미국과 중국의 글로벌 기업들은 현재 엄청난 자금을 풀어 전 세계의 유능한 기업과 인재를 끌어들이고 있습니다. 구글, 페이스북, 마이크로 소프트, 바이두 이 네 기업이 2015년에 인공지능 관련 기업을 인수하거나 인력을 스카우트 하는데 쓴 돈이 10조원에 달할 정도입니다. 인공지능 기술을 갖고있는 기업들은 계속 성장해 나갈것이고 없으면 소멸될 운명을 갖게 될것입니다. 그리고 궁극에 가서는 이 작은 기술력이 국가 경쟁력을 결정할것입니다. 이제는 미래에 어떤 일자리가 새로 만들어졌을때 기존의 일자리에서 빨리 이동해갈수 있는 역량을 키워주는 교육이 필요합니다.
2. 교육목표
  • 이 교육은 미래의 일자리를 대비하는 교육이자 새로운 기술의 변화에 빠르게 적응할수있는 능력을 키워주는 교육입니다. 컴퓨터 전공자가 아니더라도 인공지능에 관심이 있는 사람이면 누구나 미래에 다가올 알고리즘 사회에 적응할수 있는 기술력을 키우는 교육을 받아야합니다. 지금 우리가 감탄하고 놀라는 기술들도 처음엔 호기심 많은 누군가의 필요와 동기에 의해 만들어졌습니다. 저희는 이 교육을 통해 바로 그 동기부여를 교육생들에게 심어주려합니다. 변화의 와중에 마주할 문제들을 상상하고 하나하나 풀어가겠다는 강한 동기부여를 이 교육을 통해 같이 이루어나가도록 하겠습니다.

  • SQL 을 통해서 데이터 검색 능력과 분석능력을 키웁니다.
    PL/SQL 을 통해서 데이터 프로그래밍 스킬을 키우고 머신러닝 기본 알고리즘 중 C4.5 알고리즘을 이용하여 데이터를 가지고 학습한 PL/SQL 프로그램을 개발하여 머신러닝을 이해합니다.
    프로그래밍 언어중 초보자도 배우기 쉽게 데이터 분석에 아주 적합한 파이썬을 이용하여 컴퓨터에서 동작하는 프로그램을 효율적이고 정확하게 작성할수 있도록 머신러닝에 필요한 중요 알고리즘을 학습합니다.
    파이썬의 Beautiple soup 모듈을 이용해서 웹 스크롤링하는 방법을 학습하여 웹에 있는 다양한 빅데이터를 직접 수집하는 능력을 키웁니다.
    리눅스의 기본 명령어를 숙지하고 기본 수학적 알고리즘을 쉘프로그래밍을 통해 구현합니다.
    통계 패키지인 R 의 기본 문법을 숙지하고 머신러닝 기반의 기계학습을 구현 하며 R 을 이용해서 데이터를 시각화하는 방법을 학습합니다.
    빅데이터를 저장하고 분석할 하둡 시스템을 이해하고 23억건의 데이터를 저장 하고 데이터를 병렬로 처리하고 Hive와 Pig NoSQL 을이용해서 분석하는 방법 을 학습합니다..
    머신러닝 분야의 표준 언어인 파이썬을 이용해 회귀분석, 군집화, 합성곱 신 경망 등을 실습하여 딥러닝을 이해합니다.
    창업 또는 취업시 필요한 인공지능에 관련한 다양한 개별 프로젝트를 완성하여 개인이 가지고 있는 좋은 아이디어를 프로그래밍으로 구현할수 있는 힘을 키웁니다.
3. 교육대상
  • - 미취업자, 졸업예정자
  • - IT/SW 관련학과 졸업자 우대
  • - 인공지능에 관심이 있는 미취업자 , 졸업 예정자
4. 선수지식
  • -
5. 사용소프트웨어 및 실습장비
  • Windows 7, 컴퓨터 DB400S2A(RAM : 8GB)
  • Linux Cent OS 5.8이상
  • Eclipse IDE 4.2 이상
  • R
  • NoSQL Library
  • Hadoop Library
  • python
  • Oracle Database 11g, 12c Enterprise Edition
  • Data Warehousing Builder
  • Work Station - Ultra25
  • Work Station - Blade150
  • Server - T2000
  • Server - Sunfire3800
  • Server - 220R
6. 교육세부내용


교과명 학습내용 시수

데이터 분석을 위한 SQL과
PL/SQL 활용

기본 SQL 작성하기 90H
고급 SQL 작성하기
절차형 SQL 작성하기
응용 SQL 작성하기
파이썬을 활용한
빅데이터 수집
SW아키텍처 교육하기 172H
SW아키텍처 활용 지원하기
SW아키텍처 준수 통제하기
논리 데이터저장소 확인하기
물리 데이터저장소 설계하기
데이터 조작 프로시저 작성하기
뎅디터 조작 프로시저 최적화 하기
데이터 수집 계획 수립하기
빅데이터 수집 시스템 구축하기
내부 데이터 수집하기
외부 데이터 수집하기
데이터 변환하기
수집 데이터 검증하기
리눅스 운영체제 이해 리눅스 운영체제에 대한 이해 및 설치 80H
리눅스 기본 명령어
리눅스 쉘 프로그래밍
하둡과 Non SQL을 활용한
빅데이터 저장 및 탐색
빅데이터 저장 계획 수립하기 135H
빅데이터 저장 모델 설계하기
빅데이터 저장 관리시스템 구성하기
빅데이터 적재하기
빅데이터 운영하기
기본통계 확인하기
데이터터 분포 분석하기
변수간 관계 확인하기
데이터 적제하기
데이터 변화 적재하기
분석용 데이터 검증하기
R을 활용한 빅데이터
분석 및 시각화
빅데이터 처리계획 수립하기 315H
빅데이터 처리시스템 구성하기
분산병렬 수갱하기
실시간 수행하기
이벤트처리 수행하기
가설설정하기
빅데이터 모델 개발하기
빅데이터 모델 평가 검증하기
빅데이터 모델 운영방안 마련하기
머신러닝 수행방법 계획하기
데이터넷 분할하기
지도학습 모델 적용하기
자율학습 모델 적용하기
모델성능 평가하기
학습결과 적용하기
텍스트마이닝 기반 데이터분석 방법 계획하기
텍스트 변환하기
단어사전 구축하기
텍스트 분류 결과 확인하기
정형데이터 결합 분석 수행하기
분석결과 스토리텔링하기
분석정보 시각화하기
분석정보 시각표현하기
파이썬을 활용한 머신러닝
기반 빅데이터 분석
딥러닝 개념잡기 200H
딥러닝 알고리즘과 신경망 구축
텐서플로 설치 및 기본코드 구현
인공지능 알고리즘 코드의 이해
인공지능 수학 알고리즘 코드 구현
인공지능 게임 프로그램 개발
인공지능 기본 개념의 이해
인공지능 파이썬 코드 기초 설명
텐서플로 프로그래밍
머신러닝을 활용한 프로그램 개발
합계 992H
7. 훈련(연수)과정 KeyPoint!!
  • ○ 전문성 있는 기업실무기반의 훈련진행
  • - PM급 개발자의 맨토링에 따라 교육의 방향성을 잃지 않으며, 취업에 대한 고민과 부담감을 해소할 수 있으며, 프로젝트훈련과정 시작부터 최종 종료까지 철저한 맨토링을 통해 실전 프로젝트의 완성도를 극대화할 수 있다.

  • ○ 실제업무 중 돌발사항 대응법과 문제해결 노하우, 팁 등을 제공
  • - 훈련생들 우물안 개구리식 교육이 아니라 실제 프로젝트와 실무 경험에 의한 교육을 받음으로써, 보다 현업에 대한 적응력을 높이고, 교육과 현업간의 이질감을 최소화 시키며, 돌발사항 대응법과 문제해결 노하우, 팀 등을 전수받음으로써 1년차 이상의 경력자와 동일한 실력을 가질 수 있다.

  • ○ 최신 트랜드를 반영한 신기술 CASE STUDY
  • - 서버, 스토리지, SW 등 IT자원을 필요할 때 인터넷을 통해 서비스 형태(as a service)로 이용하는 클라우드 컴퓨팅 서비스, 클라우드 플랫폼, 그린 IDC 등을 Case Study함으로 써 훈련생이 그린IT 신기술 및 트랜드를 경험할 수 있다.
8. 수료 후 진출분야
  • · 빅데이터와 인공지능을 활용한 기업의 개발자
  • · 빅데이터와 인공지능을 활용한 창업
  • · 머신러닝 기법을 활용한 빅데이터 분석가
  • · 빅데이터 시스템 구축 및 분석 회사

  • 훈련과정 : Big data & Cloud Computing환경에서의 Data Specialist 양성 과정
  • 훈련비용 : 0원(국가기간 전략산업직종훈련 / 전액국비지원)
  • 훈련직종 : 정보시스템구축(개발)
  • 훈련코드 : 11-01-007
  • 교육일정 :
  • 교육시간 및 총시간 : 09:30 ~18:30(총 960시간)
  • 훈련정원 : 30명
  • 훈련강사 : 탁재완
1. 교육개요
  • - 이론과 실습을 3대7의 비율로 현업에서 필요한 실무기반 기술 중심의 수업내용을 연수생들의 눈높이 맞추어 시각적인 흥미를 느끼는 레퍼런스 및 구축
      사례(Case Study) 등을 기술 난이도에 따라 단계적으로 구현함으로써, 연수생이 자발적으로 참여하도록 지도
  • - 현업에서 실제 프로젝트로 진행되고 있는 Hadoop 기반 솔루션과 현업 Project를 통해 Big-Data 활용도와 분산시스템 환경 구현방식을 몸소 체험함으로서,   프로젝트 완성도를 상용화 수준으로 높이며, 현재 트렌드에 맞는 최신기술을 습득
2. 교육목표
  • - 실무기반 기술 중심의 수업내용을 연수생들의 눈높이 맞추어 시각적인 흥미를 느끼는 레퍼런스 및 구축사례(Case Study) 등을 기술 난이도에 따라 단계적
      으로 구현함으로써, 연수생이 자발적으로 참여하도록 하는데 그 목표가 있습니다.
  • - 실제 실무기반과 동일한 Real Environment(Hardware & Software)
  • - Big-Data for the Enterprise를 위한 Oracle DB 셋팅과 LINUX Configuration
  • - LINUX & SOLARIS Admin Skill
  • - Oracle Database 11g Overview 와 Hadoop HDFS
  • - MapReduce를 활용한 대용량 데이터 통계 및 분석
  • - Hadoop 과 Oracle 기반 데이터 웨어 하우스 구성
  • - 대용량 실시간 로그 수집이 가능한 기술 습득 및 경험(실습)
  • - 데이타베이스 퍼포먼스 최적화, 마이그레이션
  • - Backup & Recovery 관련 실습 및 체험, 성능 측정 방법 및 모니터링
3. 교육대상
  • - 미취업자, 졸업예정자
  • - IT/SW 관련학과 졸업자 우대
  • - IT/SW관련 국가공인 및 국제공인자격증 소지자 우대
4. 선수지식
  • -
5. 사용소프트웨어 및 실습장비
  • Windows 7, 컴퓨터 DB400S2A(RAM : 8GB)
  • Linux Cent OS 5.8이상
  • JDK
  • Eclipse IDE 4.2 이상
  • Hadoop Library
  • RAC
  • Oracle Database 11g, 12c Enterprise Edition
  • Data Warehousing Builder
  • Work Station - Ultra25
  • Work Station - Blade150
  • Server - T2000
  • Server - Sunfire3800
  • Server - 220R
  • Storage - 6140
  • Storage - T3
  • Machine - ExaData등
6. 교육세부내용


구분 교과명 시수

소양교과

참여기업 신입예비사원 인성 및 소양교육

960H
SPEC-UP Academy

전문교과

UNIX and Linux Basic Concepts and Installation
Linux System Administration (RHEL,OEL,CentOS,Fedora)
Oracle Solaris System Installation and Administration (9,10,11)
Oracle Database 11g R2 : Introduction to SQL & PL/SQL
Oracle Database 11g R2: Administration Workshop I
Oracle Database 11g R2: Administration Workshop II
Oracle Database 12c R1: Introduction to SQL & PL/SQL
Oracle Database 12c R1: Administration Workshop I
Oracle Database 12c R1: Administration Workshop II

산업요구

Maintenance Oracle on Linux and Unix System and Windows
Advance Oracle Program with Extended SQL & PL/SQL
Oracle Real Application Cluster(RAC) Install and Administration
High Availability(HA): Oracle 11g Data Guard Administration
VLDB 1,2 (Tuning For Very Large Database)
Relational Database Modeling and Relational Database Design
Big Data Oracle Exadata Database Installation and Configuration
Oracle Exadata Database Administration & Migration
Beginning Hadoop Programming : Contructing and Configuration
Using NoSQL / Hive / Pig For Big Data
Executing and Analysis Hadoop on Cloud Environment
합계
7. 훈련(연수)과정 KeyPoint!!
  • ○ 전문성 있는 기업실무기반의 훈련진행
  • - PM급 개발자의 맨토링에 따라 교육의 방향성을 잃지 않으며, 취업에 대한 고민과 부담감을 해소할 수 있으며, 프로젝트훈련과정 시작부터 최종 종료까지
      철저한 맨토링을 통해 실전 프로젝트의 완성도를 극대화할 수 있다.

  • ○ 실제업무 중 돌발사항 대응법과 문제해결 노하우, 팁 등을 제공
  • - 훈련생들 우물안 개구리식 교육이 아니라 실제 프로젝트와 실무 경험에 의한 교육을 받음으로써, 보다 현업에 대한 적응력을 높이고, 교육과 현업간의 이질감
      을 최소화 시키며, 돌발사항 대응법과 문제해결 노하우, 팀 등을 전수받음으로써 1년차 이상의 경력자와 동일한 실력을 가질 수 있다.

  • ○ 최신 트랜드를 반영한 신기술 CASE STUDY
  • - 서버, 스토리지, SW 등 IT자원을 필요할 때 인터넷을 통해 서비스 형태(as a service)로 이용하는 클라우드 컴퓨팅 서비스, 클라우드 플랫폼, 그린 IDC 등을
      Case Study함으로 써 훈련생이 그린IT 신기술 및 트랜드를 경험할 수 있다.
8. 수료 후 진출분야
  • · JAVA 기반 응용소프트웨어 웹 개발자 분야
  • · 전자정부 프레임워크 기반 개발자 분야
  • · 스프링 프레임워크기반 웹개발자 분야
  • · Service Oriented Arichecture 객체지향 분석 설계 분야
  • · Object Oriented Analysis Developement 분야
  • · SOAP, SAAJ, JAX-RPC, WSDL, UDDI 기반 Web Service 개발분야
  • · 안드로이드 기반 응용프로그래밍 개발자 분야
  • · 데이터 모델링, DW 개발
  • · 대용량 DW/DM 또는 NoSQL DB 설계/개발/운영/Sharding구현
  • · DB(Front, Backend, Infra) 관리, 모니터링 및 개발
  • · NoSQL을 이용한 Contents DB 구축/관리운영
  • · 대용량 데이터 개발/관리, 데이터 모델링 및 시스템 구축
  • · Stored Procedure 개발 및 튜닝, DBA, DA, BI, DW, OLAP, ETL
  • · 데이터 모델링 및 시스템 구축
  • · DW/Data Mart 모델링 및 개발
  • · 데이터베이스 엔진 스플렁크 엔지니어
  • · 데이터베이스 기반 솔루션 개발자