https://brunch.co.kr/@yysttong/6
brunch.co.kr
https://medium.com/@kass09/spark-streaming-kafka-in-python-a-test-on-local-machine-edd47814746
medium.com
https://hero0926.tistory.com/5
[스파크 기초 시리즈] 스파크 스트리밍
여태까지는 저장된 데이터를 가져다가 썼다. 그렇다면 이제는 (거의) 실시간으로 흐르는 데이터를 찾아 처리해보자. 혹시 여태까지의 rdd와 데이터셋에 대한 이해가 아직 잘 이루어지지 않았다면 넘어가셔도 좋다!..
hero0926.tistory.com
https://glow153.tistory.com/16
[Bigdata] Hadoop, Spark, Zeppelin 연동 시스템 구축
요즘 빅데이터를 공부할 때 Hadoop, Spark, Zeppelin을 사용하고 있다. Hadoop은 HDFS로써 데이터 저장소의 역할을 하고, Spark는 분석 엔진의 역할, Zeppelin은 인터페이스의 역할을 한다. 이들을 하나의 서버에..
glow153.tistory.com
'Python' 카테고리의 다른 글
Tesseract OCR 4.0 학습 (0) | 2019.08.13 |
---|---|
Flask - Sqlalchemy (0) | 2019.08.01 |
파이선으로 엑셀 만들기(템플릿 기능 구현) (0) | 2019.07.22 |
tqdm 을 통해 테스트 상태를 유동적으로 확인해보자 (0) | 2019.07.22 |
데이터 전처리 과정 및 형태소 모듈 (0) | 2019.07.10 |