kettle入門篇(二)-java代碼組件的使用

java代碼組件的使用

連接資源庫(可參考入門篇(一))

新建轉(zhuǎn)換

需求:根據(jù)身份證,計(jì)算得出年齡和出生年月。這里我們用生成記錄組件,來模擬從表中獲取到數(shù)據(jù)。

生成記錄組件:

kettle-java-code-生成記錄組件.png

kettle-java-code-配置生成記錄.png

配置java代碼


kettle-java-code-java代碼組件.png

kettle-java-code-生成processRow方法.png
// 生成的代碼片段
public boolean processRow(StepMetaInterface smi, StepDataInterface sdi) throws KettleException {
  if (first) {
    first = false;

    /* TODO: Your code here. (Using info fields)

    FieldHelper infoField = get(Fields.Info, "info_field_name");

    RowSet infoStream = findInfoRowSet("info_stream_tag");

    Object[] infoRow = null;

    int infoRowCount = 0;

    // Read all rows from info step before calling getRow() method, which returns first row from any
    // input rowset. As rowMeta for info and input steps varies getRow() can lead to errors.
    while((infoRow = getRowFrom(infoStream)) != null){

      // do something with info data
      infoRowCount++;
    }
    */
  }

  Object[] r = getRow();

  if (r == null) {
    setOutputDone();
    return false;
  }

  // It is always safest to call createOutputRow() to ensure that your output row's Object[] is large
  // enough to handle any new fields you are creating in this step.
  r = createOutputRow(r, data.outputRowMeta.size());

  /* TODO: Your code here. (See Sample)

  // Get the value from an input field
  String foobar = get(Fields.In, "a_fieldname").getString(r);

  foobar += "bar";
    
  // Set a value in a new output field
  get(Fields.Out, "output_fieldname").setValue(r, foobar);

  */
  // Send the row on to the next step.
  putRow(data.outputRowMeta, r);

  return true;
}

點(diǎn)擊main可以生成java代碼的模板。如果需要修改,我們只要在putRow(data.outputRowMeta, r);寫自己的邏輯代碼即可。
根據(jù)我們的需求,我們需要根據(jù)身份證計(jì)算年齡和生日。所以接下來,我們只要在它標(biāo)記的TODO: Your code here. (See Sample)開始編寫自己的邏輯代碼即可。
首先需要獲取從生成記錄中獲取到我們的身份證信息。

kettle-java-code-getIdCard.png

編寫邏輯代碼

import java.text.SimpleDateFormat;
import java.util.Calendar;
import java.util.Date;

public boolean processRow(StepMetaInterface smi, StepDataInterface sdi) throws KettleException {
 if (first) {
   first = false;
 }

 Object[] r = getRow();

 if (r == null) {
   setOutputDone();
   return false;
 }

 r = createOutputRow(r, data.outputRowMeta.size());
   //身份證
   String idCard = get(Fields.In, "idCard").getString(r);
   // 判斷身份證是否為空(這里暫時(shí)只做為空校驗(yàn),暫不做正則)
   // 321111199501010101
   SimpleDateFormat format = new SimpleDateFormat("yyyyMMdd");
   try {
     if(null != idCard && idCard.length() == 18){
       String substring = idCard.substring(6, 14);
       Date parse = format.parse(substring);
       if(parse != null){
         Calendar start = Calendar.getInstance();
         Calendar end = Calendar.getInstance();
         start.setTime(parse);
         end.setTimeInMillis(System.currentTimeMillis());
         long age = end.get(Calendar.YEAR) - start.get(Calendar.YEAR);
         get(Fields.Out, "age").setValue(r, age);
         get(Fields.Out, "birth").setValue(r, parse);
           logBasic("age: " + age);
           logBasic("birth: " + parse);
       }
     }else{
         throw new Exception("身份證號不規(guī)范!無法解析"); 
     }  
   } catch (Exception e) {
     e.printStackTrace();
   }
 putRow(data.outputRowMeta, r);

 return true;
}

運(yùn)行轉(zhuǎn)換

kettle-java-code-result.png

注意點(diǎn):

  1. 獲取變量get(Fields.In, "idCard").getString(r);根據(jù)變量類型的不同,getString需要變換。

  2. 設(shè)置變量get(Fields.Out, "birth").setValue(r, parse);

  3. 日志輸出logBasic("age: " + age);

    kettle-java-code-log.png
  1. 導(dǎo)包;import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date;需要java環(huán)境或者Lib下的jar包里的類,包括kettle自帶的類都行

  2. 輸出變量,如果輸入與輸出的變量一樣,可以不寫。如果不一樣,需要在下面填寫新的變量,如圖所示:

kettle-java-code-new-var.png
  1. 最后不要忘記putRow(data.outputRowMeta, r);及return true;
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容