Skip to content
View yyokay's full-sized avatar

Block or report yyokay

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Please don't include any personal information such as legal names or email addresses. Maximum 100 characters, markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
yyokay/README.md

alt text

大数据开发项目

项目简介

大数据微服:

目标

1. 大数据采集(存储,共享交换,计算) ---ETL

1.1 元数据管理
1.2  数仓管理

2. 大数据处理         ---ETL

2.1. 大数据在线处理(spark,flink)
2.2. 大数据离线处理(spark,MR,Hive)
2.3. 删除相关,缺失值填充处理,字符串替换,数据连接,数据转换,数据保存,
2.4. 数据标准化
2.5. 

3. 大数据业务支持(人物画像,推荐系统,在线训练) ---开发工程师

3.1 大数据 - 标的
3.2 大数据 - 建模
3.3 大数据 - 分析.统计    
3.4 大数据 - 挖掘
3.5 大数据 - 机器学习

4. 大数据协同调度   ---开发工程师

4.1 大数据生态数据
4.2 大数据数据关联
4.3 大数据

5. 大数据检索引挚  ---开发工程师

6. 大数据智能    ---开发工程师

目录

项目源码:

开发说明:

  • [一、命名风格] 文件名须反映出其实现了什么类 – 包括大小写.(简洁)
  • [二、名称定义] 驼峰格式分割单词:类名(以及类别、协议名)应首字母大写;方法;变量名应该以小写字母开头;常量大写;包小写。
  • [三、代码格式] code style formatter.
  • [四、OOP规约] 当一个类有多个构造方法,或者多个同名方法,这些方法应该按顺序放置在一起;加强对静态类的管理
  • [五、集合处理].
  • [六、并发处理].
  • [七、注释规约].
  • [七、注释规约].
  • [九、README.md] 一定要写,先写业务逻辑,再开发.

开发架构(hfs):

  • hf-bins-----------------------------------shell or
  • hf-docs-----------------------------------项目文档
  • hf-etcs-----------------------------------项目配置
  • hf-libs-----------------------------------业务模块
  • hf-projects---------------------------------项目
  • hf-shares-----------------------------------底层依赖
  • hf-share-utils---------------------------底层依赖util包

开发工具:

开发环境:

  • /etc/profile.
  • /etc/hosts.
  • /etc/selinux/config
  • /etc/resolv.conf.
  • yum -y install ntp
  • ntpdate cn.pool.ntp.org
  • echo "ulimit -SHn 102400" >> /etc/rc.local
  • /etc/security/limits.conf
  • systemctl disable firewalld.service
  • systemctl stop firewalld.service
  • /etc/sysctl.conf
  • /sbin/sysctl -p
  • /root/.vimrc

版本要求:

    <java.version>1.8</java.version>
    <scala.version>2.11.8</scala.version>
    <spark.version>2.4.0</spark.version>
    <spark.scala.version>2.11</spark.scala.version>
    <hadoop.version>3.1.1</hadoop.version>
    <hbase.version>2.1.1</hbase.version>
    <hive.version>1.2.1</hive.version>
    <kafka.version>2.1.0</kafka.version><!--kafka_2.11-2.1.0-->
    <spring-kafka.version>2.1.5.RELEASE</spring-kafka.version>
    <spring-data.version>2.1.3.RELEASE</spring-data.version>
    <maven.compiler.source>1.8</maven.compiler.source>
    <maven.compiler.target>1.8</maven.compiler.target>
    <log4j.version>1.2.12</log4j.version>
    <slf4j.version>1.7.25</slf4j.version>   

Using dev evn

Getting Started

Add the development packages, build and get the development server running:

git clone https://t-git.51gjj.com/xuanwu/hfs.git

Now Hadoop system should be running on cluster ! The shell is starthadoopcluster.sh. usernames=('dda' 'ddb' 'ddc' 'dde' 'ddf') bh=/ddhome/bin apps=('zookeeper' 'hadoop' 'hbase' 'hive' 'spark') for un in ${usernames[@]};do ssh $un "$bh/zookeeper/bin/zkServer.sh start;exit" done for un in ${usernames[@]};do echo "==============$un================" ssh $un " source /etc/profile #timedatectl set-ntp yes #ntpdate -u cn.pool.ntp.org #hwclock --systohc --localtime #clock -w #systemctl disable firewalld #systemctl stop firewalld.service $bh/zookeeper/bin/zkServer.sh status $bh/hadoop/bin/hdfs --daemon start journalnode if [ $un == 'dda' ];then $bh/hadoop/sbin/start-all.sh # hdfs haadmin -transitionToStandby -forcemanual nna # hdfs haadmin -transitionToStandby -forcemanual nnb hdfs haadmin -getServiceState nna hdfs haadmin -getServiceState nnb hdfs haadmin -transitionToActive --forcemanual nna hdfs haadmin -getServiceState nna hdfs haadmin -getServiceState nnb $bh/hbase/bin/hbase-daemon.sh start master $bh/hive/bin/hive --service metastore 1>/dev/null 2>&1 & $bh/hive/bin/hive --service hiveserver2 1>/dev/null 2>&1 & fi if [ $un == 'ddb' ];then $bh/hadoop/sbin/start-yarn.sh $bh/hadoop/sbin/mr-jobhistory-daemon.sh start historyserver yarn rmadmin -getServiceState rma $bh/hbase/bin/hbase-daemon.sh start master $bh/spark/sbin/start-all.sh fi if [ $un == 'ddc' ];then $bh/hadoop/sbin/start-yarn.sh $bh/hadoop/sbin/mr-jobhistory-daemon.sh start historyserver yarn rmadmin -getServiceState rmb $bh/hbase/bin/hbase-daemon.sh start regionserver fi if [ $un == 'dde' -o $un == 'ddf' ] then $bh/hbase/bin/hbase-daemon.sh start regionserver $bh/kafka/bin/kafka-server-start.sh -daemon $bh/kafka/config/server.properties fi jps exit" done then the cluster off

Community

License

Apache License, Version 2.0 http://www.apache.org/licenses/LICENSE-2.0

《构建微服务架构》微服务化开发平台,具有统一授权、认证后台管理系统,其中包含具备用户管理、资源权限管理、网关API管理等多个模块,支持多业务系统并行开发,可以作为后端服务的开发脚手架。代码简洁,架构清晰,适合学习和直接项目中使用。核心技术采用Spring Boot2以及Spring Cloud (Finchley.M8)相关核心组件,前端采用vue-element-admin组件。 学习教程

项目中用到的技术有:

springboot 快速搭建项目

eureka 服务注册(发现)

consul 服务注册(发现),consul单独开consul分支,默认eureka

springcloud config/Apollo 配置,apollo会开单独分支,目前未做

ribbon rest请求客户端负载平衡器,springboot自带

feign rest请求声明性REST客户端,基于ribbon

Hystrix 断路器

turbine 聚合多个实例Hystrix指标流

zuul 路由器和过滤器

Sleuth 分布式跟踪

Zipkin 结合Sleuth实现链路跟踪

项目启动顺序:

eureka/consul -> config -> 剩下其他的服务``

能看到nginx欢迎界面说明,nginx安装成功

hadoop hbase 

Popular repositories Loading

  1. blockchain blockchain Public

    Forked from LiuBoyu/blockchain

    区块链 - 中文资源

  2. SpringCloud SpringCloud Public

    Forked from zhoutaoo/SpringCloud

    基于SpringCloud2.1的微服务开发脚手架,整合了spring-security-oauth2、nacos、feign、sentinel、springcloud-gateway等。服务治理方面引入elasticsearch、skywalking、springboot-admin、zipkin等,让项目开发快速进入业务开发,而不需过多时间花费在架构搭建上。持续更新中

    Java

  3. spring-cloud-base spring-cloud-base Public

    Forked from fp2952/spring-cloud-base

    spring-cloud、spring-security

    Java

  4. spring-cloud-examples spring-cloud-examples Public

    Forked from ityouknow/spring-cloud-examples

    Spring Cloud 学习案例,服务发现、服务治理、链路追踪、服务监控等

    Java

  5. springCloud_zuul_oauth2 springCloud_zuul_oauth2 Public

    Forked from julang2/springCloud_zuul_oauth2

    springCloud 网关授权

    Java

  6. pms pms Public

    Forked from vriche/pms

    物业管理

    JavaScript