bong da truc tiep

  • Sự đóng góp
  • Thời gian cập nhật 22/10/2021
  • 3 readings
  • Rating 0
  • great
  • Step on

Giới thiệu về bong da truc tiep

lich bong da viet nam

Liu Weihuai Talent He Dongjie

(Viện nghiên cứu thanh toán điện tử China UnionPay Thượng Hải 201201)

Bản tóm tắt chỉ ra rằng khi chủ thẻ sử dụng thẻ ngân hàng cho các giao dịch hàng ngày, mã danh mục người bán (MCC) có thể được sử dụng để xác định xem người bán giao dịch có phải là người bán dịch vụ ăn uống hay không, nhưng không thể chia nhỏ hơn nữa món ăn của người bán giao dịch. Để phân tích các đặc điểm trong hành vi ăn uống của chủ thẻ, một phương pháp tổng hợp dữ liệu kết hợp dữ liệu UnionPay với dữ liệu bên ngoài được đề xuất.Chọn dữ liệu phục vụ trên bản đồ Baidu làm dữ liệu bên ngoài và thực hiện phân đoạn từ tiếng Trung và xóa tên nhà hàng của các món ăn khác nhau để tạo sự phân biệt giữa các món ăn khác nhauMạng Tạp chí Giáo dục http://www.jyqkw.com
Nhóm từ khóa. Dựa trên nền tảng dữ liệu lớn UnionPay, dữ liệu Baidu và dữ liệu UnionPay được tổng hợp thông qua công nghệ MapReduce.Baidu CuisineMạng Tạp chí Giáo dục http://www.jyqkw.com
Nhóm từ khóa phân loại người bán dịch vụ ăn uống UnionPay theo món ăn. Dữ liệu người bán dịch vụ ăn uống UnionPay có thẻ ẩm thực được tổng hợp với dữ liệu giao dịch hàng ngày của chủ thẻ UnionPay để tìm hiểu đặc điểm hành vi phục vụ của chủ thẻ.

Mạng Tạp chí Giáo dục http://www.jyqkw.com
Từ khóa dữ liệu lớn, phân đoạn từ tiếng Trung, khai thác dữ liệu, tổng hợp dữ liệu, đặc điểm hành vi cung cấp dịch vụ ăn uống

Số phân loại của Thư viện Trung Quốc Mã số nhận dạng tài liệu TP3 A

doi: 10.3969 / j.issn.1674-7933.2015.04.006

Về tác giả: Liu Weihuai, nam, sinh năm 1981, thạc sĩ, trợ lý giám đốc, chủ yếu tham gia và nghiên cứu các lĩnh vực: khai thác dữ liệu nền tảng dữ liệu lớn và nghiên cứu tổng hợp dữ liệu, Email: liuweihuai@unionpay.com;

Nhân tài, thạc sĩ, kỹ sư;

He Dongjie, thạc sĩ, kỹ sư.

0 Lời nói đầu

Để làm phong phú thêm chân dung chủ thẻ, chủ thẻ được gắn thẻ theo hành vi tiêu dùng hàng ngày của chủ thẻ. Chúng tôi chọn lương thực, thực phẩm, quần áo, nhà ở và phương tiện đi lại để thực hiện nghiên cứu và sử dụng dữ liệu tiêu dùng của chủ thẻ tại Thượng Hải năm 2014 làm đối tượng nghiên cứu để phân tích đặc điểm hành vi tiêu dùng của chủ thẻ trong ngành dịch vụ ăn uống ở Thượng Hải.

Dữ liệu của UnionPay chỉ có thể xác định liệu người bán có thuộc danh mục phục vụ ăn uống hay không và không thể phân biệt thêm liệu người bán đó là nhà hàng Trung Quốc hay nhà hàng phương Tây. Do đó, cần phải sử dụng dữ liệu bên ngoài để bổ sung thông tin phân loại ẩm thực của người bán UnionPay và kết hợp dữ liệu đó với dữ liệu giao dịch UnionPay để tạo dữ liệu cơ bản về dịch vụ ăn uống của chủ thẻ và trên cơ sở này, khám phá các đặc điểm hành vi ăn uống của chủ thẻ.

1 Công nghệ liên quan

Phần này chủ yếu giới thiệu các kiến ​​thức liên quan về phân đoạn từ tiếng Trung và tổng hợp dữ liệu Chọn phân khúc từ tiếng Trung lắp ghép để phân khúc từ tiếng Trung Tổng hợp dữ liệu sử dụng mô hình lập trình MapReduce dựa trên nền tảng Hadoop.

1.1 Phân từ nói lắp

Phân đoạn từ nói lắp là một thành phần phân đoạn từ tiếng Trung trong Python[1], Phân đoạn từ phức tạp chứa ba thuật toán sau[2]:

1) Thực hiện quét biểu đồ từ hiệu quả dựa trên từ điển tiền tố và tạo biểu đồ xoay chiều có hướng (DAG) bao gồm tất cả các dạng từ có thể có của các ký tự Trung Quốc trong một câu;

2) Lập trình động được sử dụng để tìm đường đi với xác suất tối đa và kết hợp phân đoạn tối đa dựa trên tần suất từ ​​được tìm thấy;

3) Đối với các từ chưa đăng ký, Mô hình Markov ẩn (HMM) dựa trên khả năng tạo từ của các ký tự Trung Quốc được sử dụng và thuật toán Viterbi được sử dụng.

Quá trình phân đoạn từ nói lắp được chia thành ba bước[3],chi tiết như sau:

1) Tải từ điển và tạo một cây trie;

2) Với câu cần được phân đoạn, hãy sử dụng quy tắc hóa để lấy các ký tự tiếng Trung và tiếng Anh liên tiếp, đồng thời chia chúng thành danh sách các cụm từ. Sử dụng DAG để tra cứu từ điển và lập trình động cho từng cụm từ để có được đường dẫn xác suất tối đa. Cho những từ trong DAG không có trong từ điển Các từ tìm thấy được kết hợp thành một cụm từ phân đoạn mới và mô hình HMM được sử dụng để phân đoạn từ để xác định các từ mới bên ngoài từ điển;

3) Sử dụng ngữ pháp năng suất của Python để tạo trình tạo từ và trả về từng từ.

1.2 Mô hình lập trình MapReduce

MapReduce là một mô hình lập trình do Google đề xuất vào năm 2004[4], Là một triển khai liên quan của một mô hình thuật toán có khả năng xử lý và tạo ra các tập dữ liệu rất lớn. Để có thể nhanh chóng xử lý hơn 1TB dữ liệu, mô hình sử dụng phương pháp song song để phân phối tác vụ cho hàng trăm hoặc thậm chí hàng nghìn nút tính toán.

Nguyên tắc của mô hình lập trình MapReduce là sử dụng khóa / giá trị đầu vào để tạo ra khóa / giá trị đầu ra. Người sử dụng thư viện MapReduce thể hiện phép tính này trong hai chức năng: ánh xạ và thu gọn.

Hàm bản đồ chấp nhận giá trị khóa / giá trị đầu vào, sau đó tạo một tập hợp các giá trị khóa / giá trị trung gian. MapReduce tập hợp tất cả các giá trị giá trị trung gian có cùng giá trị khóa trung gian I và chuyển chúng đến hàm giảm.

Hàm giảm chấp nhận một giá trị khóa trung gian I và một bộ giá trị giá trị có liên quan. Hàm giảm kết hợp các giá trị giá trị này để tạo thành một tập hợp các giá trị giá trị nhỏ hơn. Nói chung, hàm giảm chỉ tạo ra 0 hoặc 1 giá trị đầu ra mỗi lần.

Bản đồ và các chức năng thu gọn được tóm tắt như trong Bảng 1:

Quá trình thực thi của MapReduce được thể hiện trong Hình 1. Phía bên trái của hình là một sơ đồ của việc chạy tác vụ bản đồ và phía bên phải là một sơ đồ của việc chạy tác vụ giảm.

Như thể hiện trong Hình 1, trong vùng bản đồ bên trái, khi tác vụ bản đồ bắt đầu tính toán và tạo dữ liệu trung gian, dữ liệu trung gian không được ghi trực tiếp và đơn giản vào đĩa. MapReduce sử dụng bộ nhớ để lưu dữ liệu trung gian và thực hiện một số dữ liệu trung gian trong bộ nhớ. Sắp xếp trước để tối ưu hóa hiệu suất của toàn bộ bản đồ. Giai đoạn giảm ở bên phải trải qua ba giai đoạn: Sao chép → Sắp xếp → Giảm bớt. Chúng ta có thể thấy rõ rằng giai đoạn sắp xếp sử dụng sắp xếp hợp nhất, tức là sắp xếp hợp nhất.

2 Khai thác tính năng

Phần này trước tiên giới thiệu quy trình khai thác hành vi phục vụ ăn uống, thứ hai giới thiệu phân đoạn và làm sạch từ, cuối cùng giới thiệu tổng hợp dữ liệu và khai thác tính năng dựa trên dữ liệu tổng hợp.

2.1 Quy trình khai thác

Quá trình khai thác tính năng hành vi phục vụ ăn uống được thể hiện trong Hình 2. Đầu tiên, dữ liệu phục vụ ăn uống của Baidu được phân đoạn và làm sạch để tạo thành một món ănMạng Tạp chí Giáo dục http://www.jyqkw.com
Sau đó, nhóm từ khóa được tổng hợp với dữ liệu người bán UnionPay để tạo dữ liệu người bán UnionPay với thẻ ẩm thực và sau đó được tổng hợp với dữ liệu giao dịch UnionPay để tạo thành dữ liệu phục vụ ăn uống cơ bản. Dựa vào đó, có thể khai thác các đặc điểm hành vi phục vụ ăn uống.

2.2 Tham gia

Gọi giao diện API địa điểm trên bản đồ Baidu[5], Tải xuống thông tin chi tiết về nhà hàng của các món ăn khác nhau, bao gồm tên nhà hàng, vĩ độ và kinh độ, địa chỉ cụ thể, số liên lạc, phân loại ẩm thực, thông tin đánh giá của khách hàng, v.v.

Dữ liệu phục vụ ăn uống thu được từ Baidu Maps chứa rất nhiều thông tin, nhưng chúng tôi chỉ cần tên của nhà hàng. Các trường chứa tên nhà hàng được trích xuất thông qua các kỹ thuật như tách và cắt chuỗi, và được lưu trữ trong tệp ẩm thực.

Sử dụng ngôn ngữ Python để viết tập lệnh phân đoạn từ, giới thiệu mô-đun phân đoạn từ tiếng Trung và duyệt lần lượt các tệp tên nhà hàng của tất cả 51 món ăn để phân đoạn tên nhà hàng. Sau khi phân đoạn từ,Mạng Tạp chí Giáo dục http://www.jyqkw.com
Từ khóa được lưu trong tệp phân đoạn từ tương ứng với ẩm thực.

2.3 Làm sạch

Sau phân từMạng Tạp chí Giáo dục http://www.jyqkw.com
Từ khóa, có rất nhiều ký hiệu vô dụng, các từ thông dụng, và tên đường, phố, quận, trường học, khu phố và trung tâm mua sắm.Bên trênMạng Tạp chí Giáo dục http://www.jyqkw.com
Từ khóa xuất hiện trong các tệp phân đoạn từ của mỗi món ăn, dẫn đến các món ăn khác nhauMạng Tạp chí Giáo dục http://www.jyqkw.com
Sự phân biệt từ khóa giảm, do đó, cần phải so sánh tất cả các món ăn sau khi phân đoạn từMạng Tạp chí Giáo dục http://www.jyqkw.com
Từ khóa được làm sạch.

Công việc dọn dẹp được thực hiện theo hai phần. Đầu tiên, tạo một mảng bộ lọc, đặt các ký hiệu vô dụng, các từ thông dụng và tên đường, phố, khu vực, cộng đồng, trường học và trung tâm mua sắm vào mảng bộ lọc, sau đó đi qua tệp phân đoạn từ của tất cả các món ăn. Tệp phân đoạn từ chứa mảng bộ lọcMạng Tạp chí Giáo dục http://www.jyqkw.com
Từ khóa bị loại bỏ.

2.4 Tổng hợp dữ liệu

MapReduce thực hiện tổng hợp dữ liệu, về cơ bản thực hiện tích Descartes (nối) của hai tệp dữ liệu thông qua lập trình MapReduce. Quá trình MapReduce trong Hadoop theo trình tự: đọc khối dữ liệu, thao tác bản đồ, thao tác trộn, giảm thao tác và xuất kết quả. Nói một cách đơn giản, bản chất của MapReduce nằm ở quy trình phân chia lớn và nhỏ. Để nhận ra sự kết hợp của hai tệp dữ liệu, các bộ giá trị có cùng giá trị khóa trong hai tệp dữ liệu cần được kết nối với cùng một nút rút gọn.

Trong giai đoạn bản đồ, chức năng bản đồ đọc tệp 1 và tệp 2. Để phân biệt các cặp dữ liệu khóa / giá trị từ hai nguồn, một nhãn được đặt trên mỗi phần dữ liệu (Thẻ trong Hình 3)[6]Ví dụ: Tag = Khách hàng có nghĩa là từ tệp 1, Thẻ = Đơn hàng có nghĩa là từ tệp 2. Đồng thời, giá trị khóa đầu ra của thao tác bản đồ được đặt làm khóa kết nối của hai tệp dữ liệu (Khóa nhóm trong Hình 3), nghĩa là, nhiệm vụ chính của giai đoạn bản đồ là gắn nhãn dữ liệu trong các tệp khác nhau và đặt khóa kết nối.

Trong giai đoạn xáo trộn, trình phân vùng mặc định trong Hadoop sẽ gửi đầu ra bản đồ có cùng giá trị khóa đến cùng một nút giảm.

Trong giai đoạn giảm, hàm giảm nhận được danh sách giá trị từ tệp 1 và tệp 2 với cùng một giá trị khóa, sau đó kết hợp dữ liệu trong tệp 1 và tệp 2 cho cùng một khóa, nghĩa là hoạt động nối thực được thực hiện trong giai đoạn khử. Toàn bộ quá trình nối được thể hiện trong Hình 3.

Trong quá trình khai thác tính năng hành vi ăn uống, có hai dữ liệu tổng hợp, thứ nhất là dữ liệu người bán UnionPay và ẩm thực BaiduMạng Tạp chí Giáo dục http://www.jyqkw.com
Tổng hợp từ khóa, lần thứ hai là tổng hợp dữ liệu giao dịch UnionPay và dữ liệu người bán UnionPay với thẻ ẩm thực.

Dữ liệu người bán UnionPay và Ẩm thực BaiduMạng Tạp chí Giáo dục http://www.jyqkw.com
Tổng hợp các từ khóa, vì chỉ có 51 món ăn, mỗi món ănMạng Tạp chí Giáo dục http://www.jyqkw.com
Số lượng từ khóa có hạn, vì vậy các món ăn khác nhauMạng Tạp chí Giáo dục http://www.jyqkw.com
Các từ khóa được chuyển đổi thành một mảng động hai chiều. Chiều đầu tiên của mảng đại diện cho món ăn và chiều thứ hai của mảng đại diện cho món ăn của từng món ăn.Mạng Tạp chí Giáo dục http://www.jyqkw.com
Từ khóa. MapReduce lần lượt đọc dữ liệu người bán UnionPay, lấy tên của người bán nhà hàng và duyệt qua tất cả các món ănMạng Tạp chí Giáo dục http://www.jyqkw.com
Từ khóa để xác định xem tên doanh nghiệp có chứa ẩm thực hay khôngMạng Tạp chí Giáo dục http://www.jyqkw.com
Từ khóa, gắn nhãn người bán với nhãn ẩm thực tương ứng để tạo dữ liệu người bán UnionPay với nhãn ẩm thực.

Việc tổng hợp dữ liệu giao dịch UnionPay và dữ liệu người bán UnionPay với thẻ ẩm thực yêu cầu MapReduce triển khai phép nối vì cả hai tệp dữ liệu đều lớn. Trong giai đoạn bản đồ, hãy đặt Thẻ dữ liệu giao dịch UnionPay = 0, dữ liệu người bán UnionPay với thẻ ẩm thực Tag = 1 và số người bán làm Khóa nhóm. Trong giai đoạn rút gọn, dữ liệu giao dịch UnionPay và dữ liệu người bán UnionPay có thẻ ẩm thực là đã tham gia để tạo thành Dữ liệu cơ bản về suất ăn.

2.5 Khai thác tính năng

Sau khi phân tích và điều tra hành vi ăn uống của chủ thẻ, sáu loại đặc điểm hành vi ăn uống được tóm tắt: phân phối ẩm thực, món ăn yêu thích, khẩu vị yêu thích, đám đông ăn uống, hạng ăn uống và thời gian ăn uống. Đào từng tính năng riêng biệt.

1) Phân phối ẩm thực, cho biết phân bổ tiêu dùng của chủ thẻ trong các nhà hàng của các món ăn khác nhau. Dữ liệu cơ bản về dịch vụ ăn uống bao gồm hồ sơ tiêu dùng của tất cả các chủ thẻ UnionPay trong ngành dịch vụ ăn uống, cũng như các món ăn của tất cả các nhà hàng. Thông qua chương trình MapReduce, với dữ liệu thực phẩm và đồ uống cơ bản làm đầu vào và số thẻ của chủ thẻ là chìa khóa, mức tiêu thụ của chủ thẻ trong tất cả các món ăn, bao gồm cả thời gian tiêu dùng và số tiền tiêu thụ, được tính toán để tạo thành dữ liệu phân phối các món ăn của chủ thẻ. Sử dụng dữ liệu phân phối ẩm thực của chủ thẻ làm đầu vào, thông qua chương trình MapReduce, số thẻ của chủ thẻ là chìa khóa để đếm số lượng món ăn tiêu thụ hàng năm của chủ thẻ.

2) Món ăn yêu thích, nghĩa là món ăn yêu thích của chủ thẻ trong số tất cả các món ăn. Thông qua chương trình MapReduce, dữ liệu phân phối ẩm thực của chủ thẻ được sử dụng làm dữ liệu đầu vào và số thẻ của chủ thẻ là chìa khóa. tần suất tiêu thụ hoặc số lượng ẩm thực của chủ thẻ được tìm thấy, đó là chủ thẻ. Mọi người thích ăn ẩm thực.

3) Ưa thích hương vị, nghĩa là chủ thẻ thích ăn hương vị nào. Vị được chia thành sáu loại: chua, ngọt, mặn, cay, hải sản và nhạt. Theo đặc điểm riêng của ẩm thực mà người ta chia thành các vị tương ứng. Tính toán vị trí ưa thích yêu cầu hai bước, được thực hiện lần lượt với hai tác vụ MapReduce tương ứng. Bước đầu tiên là sử dụng dữ liệu phân phối ẩm thực của chủ thẻ làm đầu vào và số thẻ của chủ thẻ làm khóa. sử dụng khẩu vị của chủ thẻ Dữ liệu phân phối được sử dụng làm đầu vào, mã số thẻ của chủ thẻ là khóa và so sánh số lượng bữa ăn cho tất cả các hương vị. Hương vị với các bữa ăn nhất là hương vị được chủ thẻ ưa thích.

4) Đám đông ăn uống, có nghĩa là chủ thẻ được chia thành các nhóm ăn uống khác nhau thông qua hành vi ăn uống của chủ thẻ. Đám đông ăn uống chủ yếu được chia thành sáu loại: đồ ăn Trung Quốc, đồ ăn phương Tây, ẩm thực, đồ ăn Đông Nam Á, bữa ăn công sở và đồ ăn nhẹ. Tham khảo phân loại ẩm thực trên Baidu Maps, Dianping, v.v., ẩm thực Trung Quốc, ẩm thực phương Tây, ẩm thực, ẩm thực Đông Nam Á và đồ ăn nhẹ chứa các món ăn khác nhau và bữa ăn làm việc được xác định bằng thức ăn nhanh. Nhóm ăn uống của chủ thẻ được tính toán, thông qua chương trình MapReduce, dữ liệu cơ bản của dịch vụ ăn uống được sử dụng làm đầu vào và số thẻ của chủ thẻ là chìa khóa. Chủ thẻ so sánh thời gian tiêu dùng của mình giữa sáu loại nhóm ăn uống và nhóm ăn uống có thời gian tiêu dùng nhiều nhất có thể được xác định là nhóm ăn uống mà chủ thẻ thuộc về.

5) Hạng ăn uống được chia thành năm hạng theo mức tiêu dùng trung bình của chủ thẻ. Dianping được chia thành năm hạng theo mức tiêu thụ bình quân đầu người. Bài viết này giới thiệu cách phân chia mức tiêu thụ bình quân đầu người của Dianping, được chia thành 2 ~ 3 người mỗi bữa ăn làm tiêu chuẩn để phân chia lượng tiêu thụ trung bình, như được hiển thị trong Bảng 2. Thông qua chương trình MapReduce, dữ liệu giao dịch UnionPay được sử dụng làm dữ liệu đầu vào và số thẻ của chủ thẻ là chìa khóa. Trong giai đoạn bản đồ, số tiền tiêu thụ của chủ thẻ được tính mỗi lần và số lượng tiêu dùng được đặt thành 1. Trong giảm giai đoạn, mức tiêu dùng của chủ thẻ và mức tiêu dùng trước tiên Số lần được cộng dồn, và mức tiêu dùng trung bình mỗi lần được tính, sau đó mức ăn uống của chủ thẻ được đánh giá theo mức tiêu dùng trung bình mỗi lần.

6) Thời gian ăn uống, cho biết thời điểm chủ thẻ thích ăn ngoài nhất. Thời gian ăn uống được chia thành bốn khoảng thời gian: bữa sáng, bữa trưa, bữa tối và bữa tối, như trong Bảng 3. Thông qua chương trình MapReduce, với dữ liệu giao dịch UnionPay làm đầu vào, số thẻ của chủ thẻ làm chìa khóa, trong giai đoạn bản đồ, có được khoảng thời gian nào trong bốn khoảng thời gian mà thời gian tiêu dùng của chủ thẻ thuộc về và đặt số tiền tiêu dùng tương ứng với bốn khoảng thời gian của chủ thẻ Tính tổng số lần. Trong giai đoạn giảm, trước tiên hãy cộng dồn số tiền tiêu dùng và số lần tiêu dùng của bốn khoảng thời gian tương ứng, sau đó so sánh số lần tiêu dùng trước để tìm khoảng thời gian có nhiều lần nhất. Nếu thời gian giống nhau, so sánh số tiền tiêu dùng và tìm Phân đoạn thời gian tương ứng, đó là thời gian đi ăn ngoài yêu thích của chủ thẻ.

3 Phân tích kết quả

Khám phá hành vi tiêu dùng của chủ thẻ Thượng Hải trong ngành dịch vụ ăn uống vào năm 2014, phân tích các đặc điểm trong hành vi ăn uống của chủ thẻ như phân phối món ăn, món ăn yêu thích, khẩu vị yêu thích, thực khách, hạng ăn uống và thời gian ăn uống, đồng thời khám phá các quy tắc sau.

1) Người Thượng Hải yêu món ăn Quảng Đông

Đầu tiên, hãy tính toán các món ăn yêu thích của tất cả các chủ thẻ, sau đó tính số lượng người tiêu dùng của 51 món ăn. Như trong Hình 4, ba món ăn yêu thích hàng đầu của người Thượng Hải là món Quảng Đông, pizza và đồ ăn nhanh Trung Quốc.

2) Người Thượng Hải thích ăn chua

Dựa trên dữ liệu về khẩu vị mà chủ thẻ ưa thích, chúng tôi đã tiến hành khai thác khẩu vị và nhận thấy rằng khu vực Thượng Hải có nhiều người thích ăn chua nhất. Sự phân bố của sáu vị được thể hiện trong Hình 5.

3) Người Thượng Hải thích ăn một món ăn và mức tiêu thụ các món ăn hàng năm đạt 39

Dựa trên dữ liệu phân bổ các món ăn của chủ thẻ, số lượng món ăn được người dân Thượng Hải tiêu thụ trong năm 2014. Số người chỉ ăn một món ăn đứng đầu. Lợi thế về dữ liệu là rõ ràng. Như trong Hình 6, một phần là: Chủ thẻ đã tiêu thụ 39 món ăn trong năm 2014.

4) Hơn một nửa số cư dân Thượng Hải có số lượng bữa ăn trung bình dưới 100 nhân dân tệ mỗi lần, chiếm 53,8% dân số có số lượng bữa ăn trung bình dưới 100 nhân dân tệ, và hơn một nửa, như trong Hình 7. Khác Hiện tượng thú vị là số lượng bữa ăn trung bình mỗi lần lớn hơn Đám đông 400 nhân dân tệ đứng thứ hai, vượt qua đám đông ăn uống bậc hai, ba và bốn.

5) So với bữa sáng, người dân ở Thượng Hải thích ăn tối ở ngoài hơn. Đầu tiên, hãy tính khoảng thời gian mà chủ thẻ thích đi ăn ngoài, sau đó tính số người thích đi ăn ngoài trong 4 khoảng thời gian được tìm thấy. mà nhiều người thích bữa tối hơn bữa sáng.

6) Ngoài đồ ăn Trung Quốc và phương Tây, các bữa ăn công sở yêu thích của người Thượng Hải dựa trên dữ liệu về thực khách của chủ thẻ và sáu thực khách yêu thích món ăn Trung Quốc, đồ ăn phương Tây, ẩm thực, ẩm thực Đông Nam Á, bữa ăn công sở và đồ ăn nhẹ được tính Ngoài các món ăn Trung Quốc và phương Tây mà mọi người đã đạt được sự đồng thuận, Thượng Hải có số lượng bữa ăn làm việc lớn nhất. thành phố.

4 tóm tắt

Đặc điểm hành vi ăn uống của chủ thẻ thể hiện hành vi hàng ngày của chủ thẻ từ góc độ chế độ ăn uống. Do hạn chế của dữ liệu giao dịch UnionPay, không thể khai thác trực tiếp các đặc điểm hành vi cung cấp dịch vụ ăn uống. Do đó, dữ liệu phục vụ ăn uống nên được khai thác từ bên ngoài, phân đoạn từ, làm sạch và Dựa trên nền tảng dữ liệu lớn UnionPay, nó bổ sung dữ liệu người bán UnionPay, tổng hợp dữ liệu với dữ liệu giao dịch UnionPay, tạo dữ liệu cơ bản về đặc điểm hành vi ăn uống của UnionPay và tiến hành khai thác tính năng hành vi ăn uống. Kết quả dữ liệu cho thấy theo phương pháp này, không chỉ có đặc điểm về hành vi ăn uống của từng chủ thẻ mà còn có thể phát hiện được đặc điểm về hành vi ăn uống của chủ thẻ tại một khu vực nhất định.

Mạng Tạp chí Giáo dục http://www.jyqkw.com
người giới thiệu

GitHub. Phân đoạn từ tiếng Trung nói lắp. Http: / / ww w. Iteye. Com / news / 26184-jieba

Django Dream Team. Hiểu và phân tích quy trình thuật toán phân đoạn từ nói lắp của mô-đun tiếng Trung Python. Http://ddtcms.com/blog/archive/2013/2/4/69/jieba-fenci-suanfa-lijie/

CSDN. Nghiên cứu mã nguồn phân đoạn từ jieba.

http://blog.csdn.net/rav009/article/details/12220977OSDI´04, MapReduce: Xử lý dữ liệu đơn giản onLarge Clusters.

Baidu. Hướng dẫn phát triển API.

http://developer.baidu.com/map/index.php?title=webapi/guide/webservice-placeapiITEYE. Tham gia hoạt động của MapReduce.

http://bjyjtdj.iteye.com/blog/1453410

Chúc các bạn đọc tin bong da truc tiep vui vẻ!