集算器协助java处理结构化文本之对齐连接

开发 后端
数据库有关联语句,可以方便地进行对齐连接运算,但有时数据是存储在文本文件中的,用JAVA直接计算需要写大量循环语句才能实现,代码繁琐且运行低效。使用集算器来辅助Java编程,可以方便高效地解决此类问题。下面我们通过例子来看一下具体作法。

文本文件emp.txt存储着员工信息,EId等于1的员工不在该文件中。文本文件sOrder.txt存储着订单信息,其SellerId字段和emp中的EId字段相对应,SellerId等于2的订单不在该表中。部分源数据如下:

  emp.txt

sOrder.txt

现在需要将emp的Name、Dept、Gender这三个字段对齐到sOrder中,计算结果输出到新文件中。期望的计算结果如下:

集算器代码:

A1格和A2格分别从文本文件中读取数据,并存入两个变量emp和sOrder。这里使用了函数import,其默认的列分割符是tab,函数选项 @t表示将***行读为字段名。由于例子中只需要emp.txt中的部分字段,因此A1需要以字段名做参数。计算完成后,emp和sOrder的值如下图:

A3:=join@1(sOrder:s,SellerId;emp:e,EId)。函数join执行连接运算,并将两个表改名为s和e。其中函数选项@1表示左连接,即例子中的要求:将emp对齐到sOrder中。计算后结果如下:

点击蓝色链接可以看到具体的记录,如下:

右连接只是交换对齐的位置,同样可以用集算器来实现。比如将sOrder按照emp对齐,只需要在代码中交换两者的顺序,即=join@1(emp:e,EId;sOrder:s,SellerId),计算结果如下:

全连接也很容易实现,只需要使用函数选项@f,代码是:join@f(sOrder:s,SellerId;emp:e,EId),计算结果如下:

连接运算共有四种,除了上面提到的左连接、右连接、全连接,还有内连接。函数join默认执行内连接,代码是=join(sOrder:s,SellerId;emp:e,EId),计算结果如下:

回到例子中,A4:=A3.new(s.OrderID, s.Client, s.SellerId, s.Amount, s.OrderDate, e.Name, e.Dept, e.Gender)。这句代码从连接的表中取得需要的字段,组成新的结构化二维表格,计算结果如下:

对齐的工作已经完成,下面将数据输出到新的文件,代码为:=file(“E: \\result.txt”).export@t(A4)。

函数export默认使用tab作为列分割符,函数选项@t表示将字段名输出在***行。打开result.txt,可以看到内容如下:

上述脚本已经完成了所有的对其输出工作,接下来只需在JAVA代码中调用即可。

    //建立esProc jdbc连接
     Class.forName(“com.esproc.jdbc.InternalDriver”);
     con= DriverManager.getConnection(“jdbc:esproc:local://”);
     //调用esProc,其中test是脚本文件名
     st =(com.esproc.jdbc.InternalCStatement)con.prepareCall(“call test()”);
     //执行esProc存储过程
     st.execute();

只要执行上述JAVA代码,emp就会对齐到sOrder中,并将计算结果输出到result.txt文件。

下面将例子稍作改动:按动态的时间段查询sOrder中的数据,并执行同样的对齐操作,***直接将结果返回JAVA。为了实现这个例子,集算器需要定义两个参数,分别是begin和end,代表起止时间。集算器代码如下:

红色部分为改动的代码。

  A2:通过函数select对sOrder进一步过滤,过滤条件为JAVA传来的起止时间,即@begin和@end。

  A5:将A4中的计算结果输出到JDBC接口。

  JAVA代码也需要进行相应的改动,以便传入参数,并获取计算结果。代码如下:

    Class.forName(“com.esproc.jdbc.InternalDriver”);
     con= DriverManager.getConnection(“jdbc:esproc:local://”);
     st =(com.esproc.jdbc.InternalCStatement)con.prepareCall(“call test(?,?)”);
    st.setObject(1,startTime);
     st.setObject(2,endTime);
    st.execute();
    ResultSet set = st.getResultSet();

责任编辑:王雪燕 来源: 博客园
相关推荐

2015-12-18 10:10:06

集算器Java结构化

2015-12-04 10:26:31

java结构化集合运算

2021-12-29 10:51:19

JavaSPL架构

2024-10-08 10:57:04

2018-04-03 14:00:03

结构化数据非结构化数据数据库

2011-08-24 13:34:34

Oracle

2014-03-14 09:52:15

非结构化数据

2017-12-06 15:46:31

深度学习结构化数据NLP

2021-12-12 08:37:18

结构化数据非结构化数据数据

2023-12-25 15:00:18

结构化布线光纤

2024-05-27 00:32:45

2022-05-24 09:52:37

Spark SQL大数据处理Hive

2023-06-19 07:08:22

结构化数据ChatGPT

2010-01-13 13:20:08

VB.NET结构化异常

2012-02-08 15:54:05

ibmdw

2009-10-16 12:55:27

结构化布线系统

2023-07-25 17:21:20

综合布线结构化布线

2009-10-21 15:20:28

结构化布线技术

2009-10-15 13:49:23

结构化布线系统

2011-03-01 09:39:51

结构化布线
点赞
收藏

51CTO技术栈公众号