我用AI做了一個1978年至2019年中國大陸企業注冊的網站
最近星哥在GitHub上偶然發現了一個寶藏倉庫——Enterprise-Registration-Data-of-Chinese-Mainland。這個包含1978到2019年全國企業注冊信息的數據集,像一座塵封的經濟檔案庫,靜靜躺在代碼海洋里。588萬條記錄、31個省份、10個核心字段,從"東方華脈建筑設計"到"冷酸靈互娛科技",這些帶著時代印記的企業名稱背后,藏著中國改革開放42年的經濟密碼。
數據源來自 GitHub 上的開源項目 Enterprise-Registration-Data-of-Chinese-Mainland 。
全程不使用手寫代碼,僅使用AI編程工具。
![]()
技術實現思路 獲取免費服務器
? 申請免費服務器(一個月)
? 最好有域名
? 我這里申請的是騰訊云的,如果你有其他的云服務器或者虛擬機都行。
? 原始數據來自 GitHub 倉庫,格式為 CSV。
? 新建數據表、合理索引
? 將csv數據導入
? 數據量較大,需要進行清洗、索引和分庫處理。
? 檢索公司名、法人、地址得出結果
? 支持模糊搜索,例如輸入“華為”即可匹配“華為技術有限公司”。
? 簡潔的搜索框 + 結果列表。
? 支持按年份、地區分類篩選。
大家可以使用github或者夸克下載。
數據源來自github: https://github.com/kinginsun/Enterprise-Registration-Data-of-Chinese-Mainland夸克下載:
我用夸克網盤給你分享了「1978-2019新注冊的企業工商信息.zip」鏈接:https://pan.quark.cn/s/efd621e2c4f9
提取碼:DLFT
文件夾以年份命名,隨便進入一個文件夾打開文件夾中的文檔
![]()
![]()
如圖表格
![]()
2.連接服務器
這步不是必須,也可以在本地電腦或者虛擬機上安裝
我這里使用的是騰訊的CodeBuddy1024送的免費1個月的輕量云
![]()
3.安裝寶塔
具體可以看一下星哥之前寫的
安裝寶塔命令
if [ -f /usr/bin/curl ];then curl -sSO https://download.bt.cn/install/install_panel.sh;else wget -O install_panel.sh https://download.bt.cn/install/install_panel.sh;fi;bash install_panel.sh ed8484bec進入寶塔
安裝WEB環境 ![]()
WEB環境安裝成功
記住mysql密碼
記住mysql的密碼,以后要用的
![]()
4.下載CodeBuddy編程工具
騰訊 CodeBuddy 是一款由騰訊云推出的智能編程助手,定位為“AI時代的編程伙伴”,通過自然語言交互幫助開發者更高效地完成從需求到上線的全流程開發。
再到本地開發電腦上安裝CodeBuddy
下載:
瀏覽器打開 https://copilot.tencent.com/點擊安裝IDE
![]()
安裝之后
![]()
新建項目文件夾
新建文件夾,命名為“AI-1978-and-2019-register-company”將csv文件放到目錄中
把zip解壓
$ ll
total 16
drwxr-xr-x 1 Administrator 197121 0 Feb 22 2020 Enterprise-Registration-Data-of-Chinese-Mainland-master/
使用CodeBuddy打開文件夾AI-1978-and-2019-register-company
提示詞:
寫一個shell腳本,將Enterprise-Registration-Data-of-Chinese-Mainland-master目錄中的csv文件批量導入到mysql數據庫中表索引要有企業名稱、法人代表、所在省份
結果得到import_to_mysql.sh文件
import_to_mysql.sh提示詞輸入之后,生成了三個文件
![]()
將文件上傳到輕量云服務器中,修改root密碼
新建數據庫 ![]()
運行
sh import_to_mysql.sh導入數據庫#!/bin/bash
# MySQL數據庫配置
DB_HOST="localhost"
DB_USER="改成你的用戶名"
DB_PASS="改成你的密碼"
DB_NAME="enterprise_registration"
# CSV文件目錄
CSV_DIR="Enterprise-Registration-Data-of-Chinese-Mainland-master/1978-2019新注冊的企業工商信息"
# 創建數據庫和表
create_database_and_table() {
echo "創建數據庫和表..."
mysql -h $DB_HOST -u $DB_USER -p$DB_PASS << EOF
CREATE DATABASE IF NOT EXISTS $DB_NAME CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
USE $DB_NAME;
DROP TABLE IF EXISTS enterprise_data;
CREATE TABLE enterprise_data (
id INT AUTO_INCREMENT PRIMARY KEY,
企業名稱 VARCHAR(500) NOT NULL,
統一社會信用代碼 VARCHAR(100),
注冊日期 DATE,
企業類型 VARCHAR(100),
法人代表 VARCHAR(100),
注冊資金 VARCHAR(100),
經營范圍 TEXT,
所在省份 VARCHAR(50),
地區 VARCHAR(100),
注冊地址 TEXT,
年份 INT,
省份 VARCHAR(50),
created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;
-- 創建索引以提高查詢性能
CREATE INDEX idx_year ON enterprise_data(年份);
CREATE INDEX idx_province ON enterprise_data(省份);
CREATE INDEX idx_reg_date ON enterprise_data(注冊日期);
EOF
}
# 導入單個CSV文件
import_csv_file() {
local csv_file="$1"
local year="$2"
local province="$3"
echo "導入文件: $csv_file (年份: $year, 省份: $province)"
# 提取文件名中的省份信息(去掉.csv后綴)
local province_name=$(basename "$csv_file" .csv)
# 使用LOAD DATA INFILE導入CSV文件
mysql -h $DB_HOST -u $DB_USER -p$DB_PASS $DB_NAME << EOF
LOAD DATA LOCAL INFILE '$csv_file'
INTO TABLE enterprise_data
CHARACTER SET utf8mb4
FIELDS TERMINATED BY ','
OPTIONALLY ENCLOSED BY '"'
LINES TERMINATED BY '\n'
IGNORE 1 LINES
(企業名稱, 統一社會信用代碼, 注冊日期, 企業類型, 法人代表, 注冊資金, 經營范圍, 所在省份, 地區, 注冊地址)
SET 年份 = $year, 省份 = '$province_name';
EOF
}
# 批量導入所有CSV文件
batch_import() {
echo "開始批量導入CSV文件..."
# 查找所有年份目錄
for year_dir in "$CSV_DIR"/*/; do
if [ -d "$year_dir" ]; then
# 提取年份
local year=$(basename "$year_dir")
echo "處理年份: $year"
# 查找該年份下的所有CSV文件
for csv_file in "$year_dir"/*.csv; do
if [ -f "$csv_file" ]; then
# 提取省份名稱
local province=$(basename "$csv_file" .csv)
import_csv_file "$csv_file" "$year" "$province"
fi
done
fi
done
}
# 顯示導入統計信息
show_statistics() {
echo "導入完成,統計信息:"
mysql -h $DB_HOST -u $DB_USER -p$DB_Pass $DB_NAME << EOF
SELECT
年份,
COUNT(*) as 企業數量,
COUNT(DISTINCT 省份) as 省份數量
FROM enterprise_data
GROUP BY 年份
ORDER BY 年份;
SELECT
COUNT(*) as 總企業數量,
COUNT(DISTINCT 省份) as 總省份數量,
MIN(年份) as 最早年份,
MAX(年份) as 最晚年份
FROM enterprise_data;
EOF
}
# 主函數
main() {
echo "=== 企業工商信息數據導入MySQL數據庫 ==="
# 檢查MySQL連接
if ! mysql -h $DB_HOST -u $DB_USER -p$DB_PASS -e "SELECT 1;" > /dev/null 2>&1; then
echo "錯誤:無法連接到MySQL數據庫,請檢查配置"
exit 1
fi
# 檢查CSV目錄是否存在
if [ ! -d "$CSV_DIR" ]; then
echo "錯誤:CSV目錄不存在: $CSV_DIR"
exit 1
fi
# 執行導入流程
create_database_and_table
batch_import
show_statistics
echo "=== 導入完成 ==="
}
# 使用說明
usage() {
echo "使用方法:"
echo " ./import_to_mysql.sh # 執行完整導入流程"
echo ""
echo "配置說明:"
echo " 請修改腳本開頭的數據庫配置:"
echo " - DB_HOST: MySQL服務器地址"
echo " - DB_USER: MySQL用戶名"
echo " - DB_PASS: MySQL密碼"
echo " - DB_NAME: 數據庫名稱"
}# 參數處理
case "$1" in
-h|--help)
usage
exit 0
;;
*)
main
;;
esac
數據庫導入成功之后,用寶塔自帶的phpmyadmin查看數據。
![]()
創建web站點的提示語
輸入提示語
請幫我創建一個web站點
前端使用 html ,前端界面要美觀大方、自適應移動端
后端使用 php8.2數據庫配置如下:
用戶名:star
密碼是:改成你自己密碼
主機:127.0.0.1
端口是:3306
數據庫名:enterprise_registration
做一個企業查詢的站點
可以根據企業名稱、法人姓名、查詢公司詳情
最后給我創建了如下的文件
![]()
寶塔新建站點 新建站點
使用域名:cha.xgss.net
如圖新建站點
![]()
上傳文件 ![]()
域名解析到輕量云
調試結果
![]()
有如下bug
有如下BUG,請幫我解決
1.點擊查詢按鈕數據查不到
2.輸入法人代表或者企業名稱需要查詢到相關信息把提示詞喂給CodeBuddy,讓CodeBuddy來調試
應用場景
? 學術研究:經濟學、社會學研究者可用來分析企業發展趨勢。
? 商業分析:投資人或咨詢公司可快速定位目標企業。
? 個人興趣:普通用戶也能一窺中國企業發展的歷史脈絡。
做這個網站的過程,讓我再次體會到:數據只有被激活,才真正有價值。AI不是替代人,而是幫助我們提高效率的工具。
如果你也對這個項目感興趣,可以去 GitHub 上看看原始數據,或者嘗試自己搭建一個查詢工具。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.