Apache lợn là một trừu tượng hơn MapReduce. Nó là một công cụ/nền tảng được sử dụng để phân tích các bộ dữ liệu lớn hơn của họ đại diện cho dòng chảy dữ liệu Hoa Kỳ. Lợn thường được sử dụng với Hadoop; Chúng tôi có thể thực hiện tất cả các hoạt động thao tác dữ liệu bằng cách sử dụng Apache Hadoop lợn.Để viết chương trình phân tích dữ liệu, lợn cung cấp một ngôn ngữ cấp cao được gọi là lợn Latin. Ngôn ngữ này cung cấp các nhà khai thác khác nhau bằng cách sử dụng mà lập trình viên có thể phát triển các chức năng riêng của mình để đọc, viết, và xử lý dữ liệu.Để phân tích dữ liệu bằng cách sử dụng Apache lợn, lập trình viên cần phải viết kịch bản bằng cách sử dụng ngôn ngữ Pig Latin. Tất cả các tập lệnh nội bộ được chuyển đổi sang thư mục và làm giảm công việc. Apache lợn có một thành phần được gọi là lợn kiếm chấp nhận kịch bản Pig Latin chúng tôi nhập và chuyển đổi những kịch bản vào các công việc MapReduce.
đang được dịch, vui lòng đợi..
