自动分词

接口简介

自动分词接口是根据词语在语境中的语义关系,进行准确的切分。流程如下:

第一步、向服务器传入一段普通文本。
第二步、服务器接收传入文本,并进入HowNet知识库,进行多次循环解析。
第三步、通过多次循环解析,得到每个词语在语境中的语义。
第四步、根据语义将每个词语进行分割,以句为单位按词语的先后顺序放入数组,并返回结果。在线体验>>

接口特性

基于语义的精准分词解析。自动分词接口是基于HowNet知识库,对每一个潜在词语(每一种可能的词语组合)的语义进行反复解析,并根据词语在语境中的意思,选择最终分词结果,这样就大大提高了分词的精确度。例如,在“美国会对中东地区采取军事行动”与“美国会今日对总统提案进行了投票”两句中,对于“美国会”三个字的正确分析。前者最终的分析结果会是:“美国/会/对/中东/地区/采取军事行动”,而后者的分析结果则是“美/国会/今日/对/总统/提案/进行/了/投票”。

接口调用

调用信息

接 口 URL  http://yuzhinlp.com/api/getWordSeparated.do
请 求 方 式 POST
字 符 编 码 UTF-8
请 求 参 数 apiKey 注册用户的认证唯一标识,用户注册登录后即可看到 必填参数
input 需要分析的文本(长度尽量限制于500字以内) 必填参数
返 回 结 果 JSON字符串。若返回成功,则字符串为{"success": 结果 },
若返回失败,则字符串为{"error": 错误原因 }

调用演示

1、代码参考
import java.util.ArrayList;
import java.util.List;
import org.apache.http.NameValuePair;
import org.apache.http.client.entity.UrlEncodedFormEntity;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpPost;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.message.BasicNameValuePair;
import org.apache.http.util.EntityUtils;
import com.alibaba.fastjson.JSONObject;


public class ApiTest {
	public static void main(String[] args){
		//创建post请求
        CloseableHttpClient httpclient = HttpClients.createDefault();
        HttpPost httpPost = new HttpPost("http://yuzhinlp.com/api/call_chn.do");
        //post请求传入参数
        List<NameValuePair> parameters = new ArrayList<NameValuePair>();
        parameters.add(new BasicNameValuePair("apiKey", YourAPIKey));
        parameters.add(new BasicNameValuePair("input", "语知引领可解释NLP技术发展"));
        CloseableHttpResponse response = null;
        try {
        	UrlEncodedFormEntity formEntity;
			formEntity = new UrlEncodedFormEntity(parameters, "UTF-8");//设置参数编码
        	httpPost.setEntity(formEntity);
            // 执行请求
            response = httpclient.execute(httpPost);
            // 判断返回状态是否为200
            if (response.getStatusLine().getStatusCode() == 200) {
            	//调用结果
            	String content = EntityUtils.toString(response.getEntity(), "UTF-8");
            	System.out.println(content);		            	
	         }
        } catch (Exception e) {
        	// TODO Auto-generated catch block
        	e.printStackTrace();
		} finally {
			try {  
	            if (response != null) {
	                response.close();
	            }
				httpclient.close();
			} catch (IOException e) {
				// TODO Auto-generated catch block
				e.printStackTrace();
			}
        }
	}
}
							
2、返回结果
{
    "success": [
        "ROOT", 
        "语", 
        "知", 
        "引领", 
        "可解释", 
        "NLP", 
        "技术", 
        "发展", 
        "。"
    ]
}