Apache beam
Apache Beam, Apache Airflow, Apache Atlas 설명
Apache Beam Apache Beam은 data processing pipeline을 정의할 수 있는 오픈소스 프로그래밍 모델이다. Apache Beam은 배치 프로세싱과 스트리밍 프로세싱을 모두 지원한다. Beam에서 pipeline을 정의한 후, Beam..
[GCP] Apache Beam 사용하기
대량의 데이터를 전처리하는 건 많은 시간이 소요된다. Cloud 상에서 가용한 자원들을 동적으로 할당해서 좀 더 빠르게 해줄 수 있으면 좋은데, 병렬처리라는 게 또 공부하려면 만만찮아서인지 GC
Apache Beam 프로그래밍 모델 | Cloud Dataflow | Google Cloud
Apache Beam은 일괄 및 스트리밍 데이터 동시 처리 파이프라인을 정의할 수 있는 오픈소스 통합 모델입니다. Apache Beam 프로그래밍 모델을 사용하면 대규모 데이터 처리 방식이 간단해집니다. Apache B
Apache Beam 및 텐서플로우를 사용한 머신러닝 | Cloud Dataflow | Google Cloud
이 둘러보기에는 Apache Beam, Google Dataflow, TensorFlow를 사용하여 머신러닝 모델을 사전 처리하고, 학습시키고, 예측하는 방법이 나와 있습니다. 이러한 개념을 설명하기 위해 이 둘러보기에서는 분��
A Quick Demo of Apache Beam with Docker
Apache Beam is a unified programming model to create Batch and Stream data processing pipelines. Simplifying a bit, it's a Java SDK that we…
Running an Apache Beam Pipeline over Spark on Kubernetes
We were asked to build a quick demo to show Spark jobs running on Kubernetes and so as ever we decided to see if there was something fun we could do to learn something new and make the demo a little unique. So having scoured the web for ideas we settled on