阿里云日志服务SLSStorm消费-云淘科技

日志服务LogHub提供了高效、可靠的日志通道功能，您可以通过Logtail、SDK等多种方式来实时采集日志数据。采集日志数据之后，可以通过Storm实时消费写入到日志服务中的数据。为了降低Storm消费的代价，日志服务提供了LogHub Storm Spout来实时读取日志数据。

基本结构和流程

前提条件

已创建RAM用户并完成授权。具体操作，请参见创建RAM用户并完成授权。
已配置环境变量ALIBABA_CLOUD_ACCESS_KEY_ID和ALIBABA_CLOUD_ACCESS_KEY_SECRET。具体操作，请参见配置环境变量。

重要
- 阿里云账号的AccessKey拥有所有API的访问权限，建议您使用RAM用户的AccessKey进行API访问或日常运维。
- 强烈建议不要把AccessKey ID和AccessKey Secret保存到工程代码里，否则可能导致AccessKey泄露，威胁您账号下所有资源的安全。

示例

Spout使用示例，用于构建Storm Topology。

     public static void main( String[] args )
    {   // 使用本地测试模式。  
        String mode = "Local";  
       // 每个Topology需要设定唯一的消费组名称。
        String consumer_group_name = "";   
        String project = "";     
        String logstore = "";   
       // 设置日志服务的服务接入点。
        String endpoint = "";  
       // 本示例从环境变量中获取AccessKey ID和AccessKey Secret。
        String access_id = System.getenv("ALIBABA_CLOUD_ACCESS_KEY_ID"); 
        String access_key = System.getenv("ALIBABA_CLOUD_ACCESS_KEY_SECRET");
        // 构建一个Loghub Storm Spout需要使用的配置。
        LogHubSpoutConfig config = new LogHubSpoutConfig(consumer_group_name,
                endpoint, project, logstore, access_id,
                access_key, LogHubCursorPosition.END_CURSOR);
        TopologyBuilder builder = new TopologyBuilder();
        // 构建Loghub Storm Spout。
        LogHubSpout spout = new LogHubSpout(config);
        // 在实际场景中，Spout的个数可以和Logstore Shard个数相同。
        builder.setSpout("spout", spout, 1);
        builder.setBolt("exclaim", new SampleBolt()).shuffleGrouping("spout");
        Config conf = new Config();
        conf.setDebug(false);
        conf.setMaxSpoutPending(1); 
        // 如果使用Kryo进行数据的序列化和反序列化，则需要显示设置LogGroupData的序列化方法LogGroupDataSerializSerializer。
        Config.registerSerialization(conf, LogGroupData.class, LogGroupDataSerializSerializer.class);
        if (mode.equals("Local")) {
            logger.info("Local mode...");
            LocalCluster cluster  = new LocalCluster();
            cluster.submitTopology("test-jstorm-spout", conf, builder.createTopology());
            try {
                Thread.sleep(6000 * 1000);   
            } catch (InterruptedException e) {
                e.printStackTrace();
            }  
            cluster.killTopology("test-jstorm-spout");
            cluster.shutdown();  
        } else if (mode.equals("Remote")) {
            logger.info("Remote mode...");
            conf.setNumWorkers(2);
            try {
                StormSubmitter.submitTopology("stt-jstorm-spout-4", conf, builder.createTopology());
            } catch (AlreadyAliveException e) {
                e.printStackTrace();
            } catch (InvalidTopologyException e) {
                e.printStackTrace();
            }
        } else {
            logger.error("invalid mode: " + mode);
        }
    }

消费数据的bolt代码示例，打印每条日志的内容。

public class SampleBolt extends BaseRichBolt {
    private static final long serialVersionUID = 475265688777440****;
    private static final Logger logger = Logger.getLogger(BaseBasicBolt.class);
    private OutputCollector mCollector;
    @Override
    public void prepare(@SuppressWarnings("rawtypes") Map stormConf, TopologyContext context,
            OutputCollector collector) {
        mCollector = collector;
    }
    @Override
    public void execute(Tuple tuple) {
        String shardId = (String) tuple
                .getValueByField(LogHubSpout.FIELD_SHARD_ID);
        @SuppressWarnings("unchecked")
        List logGroupDatas = (ArrayList) tuple.getValueByField(LogHubSpout.FIELD_LOGGROUPS);
        for (LogGroupData groupData : logGroupDatas) {
            // 每个logGroup由一条或多条日志组成。
            LogGroup logGroup = groupData.GetLogGroup();
            for (Log log : logGroup.getLogsList()) {
                StringBuilder sb = new StringBuilder();
                // 每条日志，有一个时间字段，以及多个Key，Value对。
                int log_time = log.getTime();
                sb.append("LogTime:").append(log_time);
                for (Content content : log.getContentsList()) {
                    sb.append("	").append(content.getKey()).append(":")
                            .append(content.getValue());
                }
                logger.info(sb.toString());
            }
        }
        // 在LogHub Spout中，强制依赖Storm的ACK机制，用于确认Spout将消息正确发送至bolt，所以在bolt中一定要调用ACK。
        mCollector.ack(tuple);
    }
    @Override
    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        //do nothing
    }
}

添加Maven依赖

Storm 1.0版本及之前版本（如0.9.6版本），请使用：
```
  com.aliyun.openservices
  loghub-storm-spout
  0.6.6
```

storm 1.0版本及之后版本，请使用：


  com.aliyun.openservices
  loghub-storm-1.0-spout
  0.1.3

内容没看懂？不太想学习？想快速解决？有偿解决：联系专家

阿里云企业补贴进行中：马上申请

腾讯云限时活动1折起，即将结束：马上收藏

 同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折，更有现金返利:同意关联，立享优惠

转转请注明出处：https://www.yunxiaoer.com/159784.html

阿里云日志服务SLSStorm消费-云淘科技

基本结构和流程

前提条件

示例

添加Maven依赖

联系我们

400-800-8888

阿里云日志服务SLSStorm消费-云淘科技

基本结构和流程

前提条件

示例

添加Maven依赖

相关推荐

阿里云云原生大数据计算服务 MaxCompute转义字符-云淘科技

阿里云云原生大数据计算服务 MaxCompute在SQL语句中设置Flag示例-云淘科技

阿里云云原生大数据计算服务 MaxComputeNVL-云淘科技

阿里云RDS数据库空间管理-云淘科技

阿里云云原生大数据计算服务 MaxCompute创建表-云淘科技

联系我们

400-800-8888